🚀 Break Inertia. AI Your Business in 3 Days with our Free Bot! Book your 15min Demo Now!
RAG Reranking King
Bij Pandorabot.io begrijpen we de uitdagingen waarmee organisaties worden geconfronteerd als het gaat om het efficiënt toegang krijgen tot en gebruiken van de kennis in hun uitgebreide verzamelingen technische documenten. We zijn gespecialiseerd in het leveren van op maat gemaakte KnowledgeBots die specifiek zijn ontworpen om de uitdaging van kennisverwerving op te lossen, zelfs in de meest complexe situaties.
4/21/20246 min read


Here is the Dutch translation of your article:
In dit artikel verkennen we hoe geavanceerde technieken zoals Retrieval-Augmented Generation (RAG), embeddings, similarity search en reranking de kennisophaling in technische domeinen kunnen revolutioneren.
Retrieval-Augmented Generation (RAG): Retrieval-Augmented Generation (RAG) is een krachtige aanpak die informatieophaling combineert met taalmodellen voor generatie. In de context van technische documenten stelt RAG kennisophalingssystemen in staat om niet alleen relevante passages te vinden, maar ook om samenhangende en informatieve antwoorden te genereren op basis van de opgehaalde informatie. Door de sterke punten van zowel retrieval als generatie te benutten, maakt RAG nauwkeurigere en contextbewuste kennisophaling mogelijk uit technische documenten.
Embeddings en Similarity Search: Embeddings zijn dichte vectorrepresentaties van tekst die semantische betekenis en relaties tussen woorden of passages vastleggen. Door technische documenten en diagrammen om te zetten in embeddings, kunnen we efficiënte similarity searches uitvoeren om relevante informatie te vinden op basis van de semantische gelijkenis tussen de query en de embedded documenten. Deze aanpak gaat verder dan het matchen van zoekwoorden en maakt het mogelijk documenten op te halen die conceptueel gerelateerd zijn aan de query, zelfs als ze niet dezelfde termen bevatten.
De Kracht van Reranking: Hoewel embeddings en similarity search een sterke basis bieden voor kennisophaling, kunnen reranking-technieken de nauwkeurigheid en relevantie van de opgehaalde documenten verder verbeteren. Tijdens een recent project met een ingenieursbedrijf, waarbij meer dan 2.000 technische documenten werden ingeladen en gevectoriseerd, werd de behoefte aan reranking duidelijk tijdens de User Acceptance Testing (UAT)-fase. De technische directeur van het bedrijf uitte de wens voor nog preciezere documentophaling. Om dit aan te pakken, hebben we uitgebreid de volgende reranking-opties getest door dezelfde vraag te stellen:
Technische Vraag: input en output voor preheat perkins 1306
Gemini 1.5: Gemini 1.5 is een state-of-the-art reranking model dat de sterke punten van meerdere taalmodellen combineert. Het houdt rekening met verschillende factoren zoals relevantie, samenhang en diversiteit om een goed afgeronde reranking van de opgehaalde documenten te bieden. Gemini 1.5 heeft veelbelovende resultaten laten zien in het verbeteren van de kwaliteit van kennisophaling in technische domeinen.
Hier is een mogelijke volgorde van relevantie op basis van de verstrekte documenten:
1. Document 0 (4008 TAG1A 644 - 882 kWm): Dit document lijkt zeer relevant omdat het specifiek het Perkins 1306-motormodel bespreekt en gedetailleerde technische gegevens biedt, inclusief secties over "Algemene installatie" en "Koelsysteem", die direct verband houden met voorverwarming.
2. Document 2 (Algemene installatie 4008TAG1A - Gematigd): Dit document biedt specifieke informatie over de algemene installatie van de 4008TAG1A-motor, die waarschijnlijk details bevat die relevant zijn voor voorverwarmingsprocedures.
3. Document 3 (4008TAG2A - Gematigde Designatie): Hoewel dit document zich richt op het 4008TAG2A-model, kan het inzichten bieden in voorverwarmingsprocedures die van toepassing zijn op de Perkins 1306-serie vanwege mogelijke overeenkomsten tussen de modellen.
4. Document 1 (DSE P810 voor Windows™ Softwarehandleiding): Dit document, hoewel gerelateerd aan de DSE-controller, kan informatie bevatten over voorverwarmingsinstellingen en configuraties die nuttig kunnen zijn.
5. Document 4 (4008TAG2A - Tropische Designatie): Net als document 3 kan dit document enkele relevante informatie bevatten vanwege gedeelde kenmerken binnen de Perkins 1306-serie.
6. Document 5 (Energiebalans 4008TAG1A - Gematigde Designatie): Dit document richt zich waarschijnlijk op energieverbruik en distributie, wat mogelijk niet direct gerelateerd is aan voorverwarming.
7. Document 6 (Geluidsgegevens Geluidsniveaus): Dit document lijkt over geluidsniveaus te gaan en zal waarschijnlijk geen informatie bevatten over voorverwarming.
8. Document 7 (4008TAG1A en 4008TAG2A - Zicht vanaf de linkerzijde (Gematigd)): Dit document biedt een visuele weergave van de motor, maar biedt mogelijk geen specifieke details over voorverwarming.
9. Document 8 (4008TAG1A en 4008TAG2A - Vooraanzicht (Tropisch)): Net als document 7 zal dit document waarschijnlijk niet direct ingaan op voorverwarmingsprocedures.
10. Document 9 (4008TAG1A en 4008TAG2A - Zicht vanaf de rechterzijde (Tropisch)): Dit document, net als documenten 7 en 8, is waarschijnlijk geen primaire bron van informatie over voorverwarming.
11. Document 10 (4008TAG1A en 4008TAG2A - Achteraanzicht (Tropisch)): Net als documenten 7, 8 en 9 zal dit document waarschijnlijk niet direct relevant zijn voor voorverwarming.
12. Document 11 (CEA6 controller unit): Dit document, hoewel gerelateerd aan een ander controller model, biedt waarschijnlijk geen specifieke details over voorverwarming voor de Perkins 1306.
[0, 2, 3, 1]
Cohere Reranker: Cohere’s rerank-multilingual-v3.0 reranking-model maakt gebruik van geavanceerd natuurlijk taalbegrip om de opgehaalde documenten te herordenen op basis van hun relevantie voor de query. Door rekening te houden met de semantische context en relaties tussen de query en de documenten, kan Cohere Reranker de nauwkeurigheid van de opgehaalde resultaten aanzienlijk verbeteren.
Cohere reranking
RerankResponseResultsItem(document=None, index=3, relevance_score=0.6087685),
RerankResponseResultsItem(document=None, index=2, relevance_score=0.2961451),
RerankResponseResultsItem(document=None, index=1, relevance_score=0.2791402),
RerankResponseResultsItem(document=None, index=6, relevance_score=0.07450026),
RerankResponseResultsItem(document=None, index=5, relevance_score=0.02092419),
RerankResponseResultsItem(document=None, index=0, relevance_score=0.016090874),
RerankResponseResultsItem(document=None, index=4, relevance_score=0.009196552)], meta=ApiMeta(api_version=ApiMetaApiVersion(version='1', is_deprecated=None, is_experimental=None), billed_units=ApiMetaBilledUnits(input_tokens=None, output_tokens=None, search_units=1, classifications=None), tokens=None, warnings=None))
Claude Opus: Claude Opus is een reranking model dat specifiek is ontworpen voor technische documenten. Het maakt gebruik van domeinspecifieke kennis en begrijpt de complexiteit van technische taal en concepten. Door zijn begrip van technisch jargon en context kan Claude Opus de opgehaalde documenten effectief herordenen om de meest relevante en informatieve resultaten te prioriteren.
Claude Opus 3
Op basis van de gegeven gebruikersvraag en de verstrekte lijst van documenten,
hier is mijn rangschikking van de documenten van meest relevant tot minst relevant om de vraag "input en output voor voorverwarming perkins 1306" te beantwoorden:
1. Het meest relevante document lijkt document 1 te zijn, aangezien
het specifiek de Perkins 1306-motor vermeldt en de input- en outputinformatie
voor het voorverwarmingssysteem beschrijft, inclusief de
voorverwarmingsschakelaar en de voorverwarmingsrelaisuitgang.
2. Document 0 zou de volgende meest relevante zijn, omdat het
het voorverwarmingssysteem in algemene termen bespreekt voor Perkins-motoren,
hoewel het niet specifiek het 1306-model vermeldt.
3. Document 2 vermeldt Perkins-motoren, maar bevat geen
informatie over voorverwarming of input/output, dus het is minder relevant
dan documenten 1 en 0.
4. Document 3 is helemaal niet relevant, omdat het over een andere
motorfabrikant (Cummins) gaat en geen melding maakt van voorverwarming.
Dus in het kort, mijn rangschikking van meest relevant tot minst relevant om
de vraag "input en output voor voorverwarming perkins 1306" te beantwoorden is:
[1, 0, 2, 3]
De combinatie van RAG, embeddings, similarity search en reranking technieken heeft het potentieel om kennisophaling in technische domeinen te revolutioneren. Door deze geavanceerde benaderingen te benutten, kunnen organisaties het volledige potentieel van hun technische documenten en diagrammen ontsluiten, waardoor sneller toegang tot relevante informatie mogelijk wordt en betere besluitvorming wordt gefaciliteerd. Naarmate we deze technieken blijven verfijnen en optimaliseren, kunnen we nog nauwkeurigere en efficiëntere kennisophalingssystemen verwachten die ingenieursbureaus en andere technische organisaties in staat stellen om voorop te blijven in het huidige concurrerende landschap.
Claude Haiku: RAG trekt diepe inzichten, Opus staat gestroomlijnd, snel — maar laten we Haiku's diepte beoordelen laag kosten / hoge snelheid:
Op basis van de gegeven gebruikersvraag "input en output voor voorverwarming perkins 1306"
en de lijst van documenten, zou ik de relevantie van de
documenten als volgt rangschikken:
De reden is:
Dit document is waarschijnlijk het meest relevant, omdat het specifiek
"Perkins 1306" vermeldt en input- en outputinformatie bespreekt,
die direct verband houdt met de vraag van de gebruiker.
Dit document vermeldt ook "Perkins 1306" en bespreekt motorspecificaties,
die relevant kunnen zijn om de vraag te beantwoorden.
Hoewel dit document Perkins-motoren bespreekt, vermeldt het niet specifiek
het 1306-model, dus het is minder direct relevant dan de bovenste
twee documenten.
Dit document bespreekt het onderhoud van Perkins-motoren, maar lijkt geen
specifieke informatie te hebben over input en output voor het 1306-model.
Dit document bespreekt problemen oplossen bij Perkins-motoren, maar heeft
ook weer geen directe informatie over het 1306-model.
Dit document bespreekt onderdelen van Perkins-motoren, maar lijkt geen
informatie te hebben die direct relevant is voor de vraag van de gebruiker.
[0, 2, 1, 3, 4, 5]
De Rol van Pandorabot.io in het Verhogen van Chatbot Ervaringen
🧠 KnowledgeBot 💰SalesBot 🛠️ ServiceBot 👁️🗨️ VisionBot
Voor bedrijven die het volledige potentieel van AI in klantinteracties willen benutten, is Pandorabot.io een toonaangevende oplossing. Gespecialiseerd in het creëren van op maat gemaakte chatbots, biedt Pandorabot.io een platform waar bedrijven chatbots kunnen ontwikkelen die niet alleen zijn afgestemd op hun specifieke behoeften, maar ook met hen mee kunnen evolueren. Onze chatbots zijn ontworpen om genuanceerde, industriespecifieke interacties te bieden, naadloze integratie met bedrijfssystemen en state-of-the-art gegevensbeveiligingsmaatregelen. Met Pandorabot.io kunnen bedrijven een chatbotervaring garanderen die de klantbetrokkenheid verhoogt, de merkreputatie versterkt en de operationele efficiëntie verbetert.


