RAG uitgelegd: laat je chatbot antwoorden op je eigen documenten

Hero foto Jelte Auteur blog

Jelte van Zanten

Marketing stagiair

19 februari 2026
6 minuten om te lezen
RAG (Retrieval-Augmented Generation) zorgt ervoor dat een chatbot antwoorden baseert op jouw eigen documenten in plaats van alleen op algemene kennis. In deze blog lees je wat RAG is, hoe het werkt en hoe je stap voor stap een RAG-chatbot bouwt die betrouwbare antwoorden geeft op basis van je interne bronnen.

Waarom een normale chatbot vaak de plank misslaat

Een standaard chatbot uit een generieke AI-tool kent jouw interne documenten niet. Denk aan handleidingen, werkinstructies, beleidsstukken, productdocumentatie of notulen. Zonder toegang tot die bronnen gaat een model aannames doen of een algemeen antwoord geven dat net niet klopt.

Zelfs als je een paar pagina’s tekst in een prompt plakt, loop je tegen grenzen aan. Het contextvenster van een model is beperkt. Bovendien wil je niet bij elke vraag handmatig teksten kopiëren en plakken.

Dit is precies waar RAG voor bedoeld is.

Wat is RAG precies?

RAG staat voor Retrieval-Augmented Generation, oftewel: genereren met opgezochte bronnen.

Het principe is eenvoudig. Voordat het taalmodel antwoord geeft, zoekt het systeem eerst relevante tekstfragmenten in jouw eigen documenten. Die fragmenten worden vervolgens als context meegegeven aan het model. Het antwoord is daardoor gebaseerd op jouw kennisbron in plaats van alleen op de algemene training van het model.

In de oorspronkelijke RAG-publicatie wordt dit omschreven als een combinatie van parametrisch geheugen (wat het model intern heeft geleerd) en niet-parametrisch geheugen (een externe index die je zelf kunt bijwerken).

Belangrijk om te weten: RAG maakt een chatbot niet automatisch “waar”. Het zorgt er vooral voor dat het model zijn antwoord kan baseren op de tekst die je hebt meegegeven, in plaats van op aannames of algemene kennis.

Hoe werkt een RAG-architectuur in de praktijk?

In een typische RAG-opzet gebeuren vier stappen:

  • Je splitst documenten op in kleinere stukken (chunks), zodat gerichte zoekopdrachten mogelijk zijn.
  • Je zet elk stuk om in een embedding: een numerieke representatie van de betekenis van de tekst. Daarmee kun je semantisch zoeken op inhoud in plaats van alleen op exacte woorden.
  • Je slaat de embeddings op in een vector index (vector store), zodat je bij een vraag snel de meest relevante stukken terugvindt.
  • Je voegt de gevonden fragmenten toe aan de prompt van het taalmodel, zodat het antwoord gebaseerd is op die context.

In veel praktische RAG-voorbeelden is dit letterlijk de volgorde: eerst zoeken, daarna de best passende resultaten meegeven aan het model om het antwoord te genereren.

Een simpele bouwroute voor beginners

Wil je zelf een RAG-chatbot bouwen? Begin klein en houd het overzichtelijk. Deze aanpak werkt in vrijwel elke technische stack:

  • Verzamel je bronnen en maak ze leesbaar, bijvoorbeeld door tekst te extraheren uit PDF, Word, wiki of HTML.
  • Deel de tekst logisch op, bijvoorbeeld per kopje of per 300 tot 800 woorden. De ideale chunkgrootte verschilt per document.
  • Maak embeddings van de tekststukken en sla ze op in een vector index.
  • Bij een vraag: zoek de meest relevante fragmenten en voeg die toe aan de prompt, inclusief titel of broninformatie.
  • Laat het model antwoorden op basis van die context en toon of log welke bronnen zijn gebruikt.

Frameworks zoals LangChain en LlamaIndex bieden hiervoor kant-en-klare bouwblokken. Daarmee hoef je minder eigen koppelingen en infrastructuur te bouwen.

Waar RAG vaak misgaat

Een RAG-architectuur klinkt logisch, maar in de praktijk zie je regelmatig dezelfde problemen.

Soms haalt de chatbot irrelevante stukken op. Het antwoord klinkt dan correct, maar sluit niet aan op de vraag. De oorzaak ligt vaak bij slechte chunking of vervuilde brondata, bijvoorbeeld kopteksten, menu’s of footers die zijn mee-geïndexeerd.

In andere gevallen worden wel de juiste stukken opgehaald, maar gebruikt het model ze onvoldoende. De informatie staat in de context, maar het antwoord dwaalt af. Dan is de prompt meestal niet duidelijk genoeg geformuleerd. Je moet expliciet aangeven dat alleen op basis van de aangeleverde context mag worden geantwoord.

Een derde probleem is schijnzekerheid. Als je geen bronvermelding afdwingt, kan een model een overtuigend antwoord geven zonder daadwerkelijk op de context te steunen. Zeker in zakelijke omgevingen is het verstandig om zichtbaar te maken welke passages zijn gebruikt, al is het maar in interne logs.

Praktische tips om betrouwbaar te starten met RAG

Begin met één duidelijke use-case, bijvoorbeeld: vragen beantwoorden over het IT-handboek. Werk met een beperkt aantal documenten en test met echte vragen van collega’s. Pas daarna schaal je op.

Drie dingen maken het verschil: schoon bronmateriaal, goede metadata en het apart testen van je retrieval-stap.

Zorg dat je documenten opgeschoond zijn voordat je ze indexeert. Rommelige PDF’s met vaste kopregels of complexe tabellen leiden vaak tot slechte chunks.

Bewaar metadata zoals documenttitel, hoofdstuk, datum of versienummer. Daarmee kun je bronverwijzingen tonen en later filteren, bijvoorbeeld op de meest recente versie van een beleidsdocument.

Test de zoekstap los van het taalmodel. Als je retrieval al onjuiste of irrelevante tekst teruggeeft, kan geen enkel model dat nog repareren.

Heb je vragen of wil je weten wat dit voor jouw kan betekenen? Neem gerust contact op.

Ontdek hier onze populaire AI-trainingen

  • Twee vrouwen en twee mannen volgen een training.
    Swipe voor meer
    ChatGPT Advanced in 1 dag
    • 1 dag
    Ben jij klaar om alles uit ChatGPT te halen? In de training ChatGPT Advanced in 1 dag zul je ontdekken hoe GPT-modellen werken, hoe jij jouw eigen GPT kunt creëren en hoe jij kunstmatige intelligentie (AI) effectief in kunt zetten door middel van slimme prompting en automatisering. Daarbij zul je l
    Bekijk deze training
  • Twee mannen en twee vrouwen volgen een klassikale training.
    Swipe voor meer
    ChatGPT Advanced in 1 dag
    • 1 dag
    Ben jij klaar om alles uit ChatGPT te halen? In de training ChatGPT Advanced in 1 dag zul je ontdekken hoe GPT-modellen werken, hoe jij jouw eigen GPT kunt creëren en hoe jij kunstmatige intelligentie (AI) effectief in kunt zetten door middel van slimme prompting en automatisering. Daarbij zul je l
    Bekijk deze training
  • Een vrouw en twee mannen volgen een training.
    Swipe voor meer
    AI Agents & Automation met Microsoft Power Platform
    • 1 dag
    In de training AI Agents & Automation met Microsoft Power Platform zul je ontdekken hoe AI Agents en Power Platform organisaties in staat stellen om snel en flexibel bedrijfsprocessen te automatiseren. Door AI en RPA te combineren met een gebruiksvriendelijke, low-code benadering, kan iedereen b
    Bekijk deze training
  • Vijf mannen volgen een training.
    Swipe voor meer
    AI Fundamentals
    • 3 dagen
    AI Fundamentals is dé training voor wie meer wil dan alleen een basiskennis van AI. In deze AI-training ontwikkel je een stevig fundament in kunstmatige intelligentie en krijg je technische inzichten om AI optimaal te benutten. In drie dagen krijg je niet alleen inzicht in wat kunstmatige intellige
    Bekijk deze training
Bekijk alle trainingen

Terugbelverzoek

Wil je meer weten, maar nu even geen tijd?

Laat je gegevens achter, dan nemen wij binnen 2 werkdagen contact met je op

Dé IT-opleider van het noorden

  • Klanten geven ons een 9.2
  • Erkende trainers
  • Ontvang een certificaat na deelname
  • Train op één van onze drie locaties of vanuit huis

Terugbelverzoek

Vul hieronder jouw gegevens in, zodat wij telefonisch contact met je kunnen opnemen.

"*" geeft vereiste velden aan

Laat ons jou terugbellen
Velden met een * zijn verplicht

Vragen of direct contact nodig, bezoek onze contactpagina.

Eliano Patty.

Eliano Patty

Hoofd sales