AI · RAG

Kennischatbots die niet liegen.

RAG-chatbots over jouw échte documentatie, beleid of productkennis. Met citaties, gemonitord, geëvalueerd — geen wrapped GPT-4 demo. Wij bouwen het type dat de scrutiny na livegang overleeft.

En waarom de meeste RAG-demo's in productie sneuvelen.

Wat RAG feitelijk is

RAG (Retrieval-Augmented Generation) is een patroon waarbij de LLM niet uit trainingsdata antwoordt, maar uit documenten die jij beheert. Het systeem haalt relevante stukken uit jouw kennisbasis en vraagt het model dan om uitsluitend op basis van die stukken te antwoorden — met citaties.

Goed gebouwd reduceert RAG hallucinaties drastisch en geeft gebruikers een reden om de output te vertrouwen. Slordig gebouwd produceert het plausibele antwoorden die het feitelijke document missen, de verkeerde bron citeren of zelfverzekerd verzinnen wat niet in de basis staat.

Het verschil zit in engineering: chunking-strategie, keuze van embeddings, retrieval-evaluatie, prompt-design, fallback-gedrag en doorlopende monitoring. Wij behandelen RAG als een echt softwaresysteem, geen weekendproject.

Waar RAG zijn plek écht verdient.

Wat we bouwen

Interne kennischatbots

Over beleid, SOP's, productdocumentatie, sales playbooks. Helpt je team antwoorden vinden zonder Slack-pings — met citaties die ze kunnen verifiëren.

Klantgerichte support-agents

Antwoorden gegrond in je echte documentatie. Weet wanneer te escaleren. Logt elk gesprek voor review.

Sales enablement assistants

Sales-specifieke kennisbots die uit productdocumentatie, concurrentie-intel en eerdere deals putten. Citeren bronnen aan je sales-team.

Compliance- & beleids-assistenten

RAG over regelgeving, intern beleid, contractclausules. Nuttig voor legal, HR, finance. Citaties zijn niet onderhandelbaar.

Multi-source agentic RAG

Bots die beslissen welke kennisbasis te raadplegen, verhelderingsvragen stellen en retrieval combineren met lichte agency waar dat zin heeft.

Zes dingen die een echt systeem onderscheiden van een demo.

Hoe we RAG bouwen die werkt

01

Cureer de kennisbasis

Garbage in = garbage out. We helpen je beslissen wat in scope is, wat verouderd is en wat herschreven moet voordat een chatbot het ooit ziet.

02

Chunking & retrieval die past bij je content

Verschillende contenttypes vragen verschillende chunking. Juridische docs ≠ FAQ's ≠ wiki's. We tunen retrieval per kennisbasis — geen defaults.

03

Citaties en 'ik weet het niet'

Elk antwoord citeert bronnen. De bot zegt 'ik weet het niet' of escaleert wanneer het antwoord niet in het corpus zit — in plaats van te verzinnen.

04

Evaluatie: golden test sets

We bouwen een testset van representatieve vragen met verwachte bronnen. Elke model- of prompt-wijziging wordt gescoord. Geen vibes-driven RAG.

05

Monitoring in productie

Alle gesprekken worden gelogd. Drift, weiger-rate, citatie-accuratesse worden bijgehouden. Je ziet wat gebruikers feitelijk vragen, niet wat je dacht.

Wat een RAG-chatbot kost

Prijzen

€20–80K

per kennisbasis gescoopt · 4–8 weken

Een productie-RAG-chatbot over een afgebakende kennisbasis kost typisch €20–50K, inclusief evaluatie-framework en monitoring. Complexere setups — meerdere kennisbases, role-based access, agentic routing — €50–80K. Plus model- en infrastructuurkosten (€50–500/mnd afhankelijk van volume).

RAG-chatbots die vandaag in productie draaien.

Wat we hebben opgeleverd

VASTGOED

Huurder-FAQ-bot

Beantwoordt huurdersvragen over het huurhandboek, gebouwregels en FAQ's. Reduceert inkomende huurdersvragen aan property managers met ~40%.

B2B-DIENSTVERLENING

Sales enablement assistant

Sales-team chatbot over productdocumentatie, concurrentie-intel en recente klantwins. Geciteerde antwoorden; logt feedback om bronnen door de tijd te verbeteren.

INTERNE TOOLS

HR-beleidschatbot

Beantwoordt medewerkervragen over verlof, secundaire arbeidsvoorwaarden en declaraties. Citeert altijd het beleid. Escaleert ambigue vragen naar HR.

Veelgestelde vragen

Een RAG-chatbot beantwoordt vragen over een kennisbasis. Een AI agent neemt acties (roept API's aan, schrijft data, voert workflows uit). Veel systemen combineren beide.

Soms. Als je kennis breed beschikbaar is op het publieke internet, voldoen algemene modellen vaak. RAG verdient zijn plek wanneer (a) je kennis privé is, (b) je traceerbare citaties nodig hebt, (c) je controle wil over wat er gezegd wordt, of (d) je metingen en drift-detectie wil — geen van die dingen biedt een generieke chatbot.

We hebben systemen gebouwd over kennisbases van een paar honderd tot tienduizenden documenten. De architectuur verandert met de schaal (vector DB-keuze, retrieval-strategie, indexing-pipeline) maar geen van beide extremen is ongebruikelijk.

Min of meer. We loggen elke interactie en brengen patronen aan het licht waar de bot fout zat. De meeste fixes zijn verbeteringen aan de kennisbasis zelf of aan retrieval — geen 'training' van het model. Doorlopende verbetering is operationeel, niet magisch.

Per kennisbasis: antwoord-accuraatheid op de eval-set, citatie-accuraatheid, weiger-rate (zegt 'ik weet het niet' wanneer dat de juiste reactie is), gebruikerstevredenheid, en downstream-impact (bv. minder tickets aan mensen).

Combineer met

Heb je een kennisbasis die je team sneller wil bevragen?

Vertel ons welke kennis en wie het zou gebruiken. Binnen één werkdag horen we of RAG past en waar te beginnen.