AI implementatie: van strategie naar productie in 5 stappen

Een opinionated routekaart in vijf stappen om AI van strategie-slide naar productiesysteem te brengen, zonder transformatieretoriek. Discovery, shortlist, build, productie, itereren.

11 mrt 2026·11 min leestijd·Productized Team

De meeste AI-strategieën stranden in 2026 op hetzelfde punt: het gat tussen een AI-strategie-slide en een AI-systeem in productie. De slide is makkelijk. Het systeem is het werk. Dit artikel is een praktische, opinionated routekaart in vijf stappen om dat gat te overbruggen — geschreven voor technische en operationele beslissers die geen zin hebben in nóg een AI-workshop met dezelfde backlog als uitkomst.

We schrijven dit als softwareleverancier die middelgrote klanten van strategie naar een live AI-systeem brengt. We hebben projecten geleverd die werken. We hebben er ook genoeg zien falen. De vijf stappen hieronder vormen het verschil — en ze zijn ongeveer hetzelfde ongeacht bedrijfsgrootte.

De vijf stappen in één tabel

Stap	Wat het is	Typische duur	Output
1. Discovery	Het echte probleem scopen	1–3 weken	Eén pijnlijke workflow, in kaart gebracht
2. Shortlist	Kies 1–2 use cases, schrap de rest	1 week	Eén bouwklare use case
3. Build	Deterministische scaffolding + AI waar het zich verdient	4–10 weken	Een werkend systeem
4. Productie	Monitoring, evaluatie, human-in-the-loop	Doorlopend vanaf week één	Een betrouwbaar systeem
5. Itereren	Meten, fixen, pas dan uitbreiden	Continu	Een systeem dat in de tijd beter wordt

Stap 1 — Discovery: scope het echte probleem

AI-projecten falen vaker bij stap nul dan bij welke latere stap dan ook. De strategie-slide zegt "automatiseer klantenservice met AI" — het echte probleem is dat 30% van de inkomende mails duplicaten van FAQ-items zijn en het team de bestaande antwoorden niet snel genoeg vindt. Dat zijn verschillende problemen met verschillende oplossingen, en de tweede is degene die de moeite waard is.

Hoe ziet discovery er in de praktijk uit:

Interview 3–7 stakeholders. Operations, support, het front-line team, IT. Niet alleen de executive sponsor.
Breng de echte workflow op één pagina in kaart. Waar komt werk vandaan, wie raakt het aan, welke tools, waar stokt het?
Identificeer de pijnlijke 80%. Het repetitieve, hoog-volume deel — niet de zeldzame, interessante edge case waar het team graag over praat.
Negeer de AI-hype. Of het antwoord AI is, een Zapier-flow of een config-aanpassing in het bestaande CRM is een vraag voor stap 2. Stap 1 is alleen begrijpen.

Wat AI-projecten doodt: beginnen vanuit "we willen iets met AI" in plaats van "deze specifieke workflow kost ons X uur / Y fouten per maand". De eerste framing maakt het project een oplossing op zoek naar een probleem; de tweede is een probleem op zoek naar de juiste oplossing.

Stap 2 — Shortlist: kies 1–2, schrap de rest

Discovery levert meestal 5–15 kandidaat use cases op. De verleiding is om ze allemaal te doen. Niet doen. Kies er één. Misschien twee als ze infrastructuur delen. Schrap de rest — voor nu.

Het 2x2 dat we gebruiken:

Impact: hoeveel tijd/geld/foutreductie levert dit op als het werkt? In concrete eenheden, niet "groot".
Haalbaarheid: is de data beschikbaar, is de workflow stabiel, is succes meetbaar, zijn stakeholders aligned?

Stop elke kandidaat in één van vier vakjes:

Hoge impact, hoge haalbaarheid: ship dit. Dit is je eerste project.
Hoge impact, lage haalbaarheid: park. Kom terug als de haalbaarheid verbetert (data, alignment, scope).
Lage impact, hoge haalbaarheid: cool maar irrelevant. Schrap — de verleidelijke val van AI-projecten die makkelijk lijken.
Lage impact, lage haalbaarheid: vanzelfsprekend schrappen.

Verbind je aan één pijnlijke, goed afgebakende job. "We brengen de tijd om inkomende vergunningsdocumenten te classificeren terug van 2 dagen naar 1 uur" is goed afgebakend. "We gaan AI gebruiken om operations te verbeteren" niet.

Stap 3 — Build: eerst deterministische scaffolding, dan AI waar het zich verdient

De grootste engineering-fout die we zien: een LLM in het centrum zetten van een workflow die het meeste niet nodig heeft. De meeste automatiserings-pipeline moet gewone code zijn — document ophalen, valideren, opslaan, routeren, notificatie versturen. De LLM is één node in de pipeline, niet de pipeline zelf.

Ons standaard buildpatroon:

Bouw de scaffolding deterministisch. Workflow-engine (n8n is onze default), bron-connectors, downstream-acties, audit logging — dat is allemaal gewone software. Geen AI.
Plug een LLM in waar die unieke waarde toevoegt. Vrij-tekst input classificeren. Velden uit rommelige documenten extraheren. Een antwoord opstellen dat een mens reviewt. Kiezen tussen branches die niet als regels zijn uit te drukken.
Bouw de evaluatieset op dag één. Echte input + verwachte output voor 50–200 voorbeelden. Run de LLM-stap tegen die set bij elke prompt- of modelwijziging.
Maak onzekerheid expliciet. De LLM moet kunnen zeggen "ik weet het niet" en doorzetten naar een mens. "Altijd antwoorden" is een bug, geen feature.
Log elke stap. Inputs, outputs, de prompt, het model, de versie. Dat heb je nodig als er iets misgaat — en er gaat iets mis.

Bouwtijd voor een verstandig gescoopt eerste AI-project: 4–10 weken. Minder is meestal een dunne demo; meer is meestal scope creep.

Stap 4 — Productie: monitoring, evaluatie, human-in-the-loop waar nodig

Een AI-systeem in productie is niet hetzelfde artefact als het prototype. Het prototype werkt op de testdata. Productie moet werken op de input van morgen, en de dag erna, als iemand een proces stroomopwaarts aanpast en het je niet vertelt.

De vier productie-essentials:

Golden test set

Een gecureerde set van 50–200 representatieve, echte inputs met verwachte outputs. Elke modelwijziging, prompt-wijziging of dependency-wijziging draait eerst tegen deze set. Regresseert de kwaliteit, dan ship je niet. Dit is de meest hefboomrijke discipline in AI-werk.

Drift-monitoring

Volg de verdeling van inputs (lengtes, talen, brontypes) en outputs (zekerheidsscores, weigeringspercentages, downstream-acties). Verschuift de verdeling, dan is er stroomopwaarts iets veranderd — onderzoek vóór gebruikers het merken.

Escalatiepaden

Als het systeem niet zeker is, retrieval mist of een uitzondering vuurt — er is een mens die het krijgt, met een queue en een SLA. "Het routeert gewoon naar Slack" is geen escalatiepad; het is een garantie dat niemand reageert.

EU AI Act risicoclassificatie — vooraf

Vanaf 2 augustus 2026 geldt de EU AI Act volledig. Classificeer je systeem in de ontwerpfase, niet ná livegang. Voor de meeste middelgrote AI-systemen is de classificatie beperkt risico: vereist transparantie en een systeemregister, geen volledige conformiteitsbeoordeling. Hoog-risico systemen (HR, finance, veiligheidskritiek) vragen om aanzienlijk meer documentatie, monitoring en menselijk toezicht — bouw dat vanaf dag één in plaats van het er later op te plakken.

Evaluatiediscipline verslaat modelkeuze, elke keer. Een team met een golden set van 200 voorbeelden en wekelijkse drift-monitoring presteert elk kwartaal beter dan een team met een gaver model en geen meting. Bouw de evaluatie vóór je de prompt tunet.

Stap 5 — Itereren: meten → verbeteren → uitbreiden

De verleiding na livegang is om aan het volgende project te beginnen. Hou je in voor 8–12 weken. De eerste versie heeft het over iets fout — meestal verschillende dingen — en de lessen uit het fixen daarvan zijn meer waard dan de volgende greenfield-build.

Hoe iteratie er in de praktijk uitziet:

Meet wat je ship'te. Niet alleen "draait het systeem". Concrete unit-economics: tijd bespaard per case, foutpercentage, escalatieratio, gebruikerstevredenheid. De metric die je in stap 2 definieerde.
Kijk naar foutpatronen, niet naar gemiddelden. Groepeer wat misgaat. Vijf terugkerende patronen zijn meer waard dan één samenvatting.
Fix de patronen. Betere prompts, betere retrieval, betere escalatieregels, betere brondata. Soms zit de fix niet in de AI — maar in het stroomopwaartse proces.
Pas dán uitbreiden. Als het eerste systeem zijn metric haalt en je de foutmodi begrijpt, is de volgende use case het juiste moment. Niet eerder.

Het patroon dat we zien bij klanten die het goed doen: één pijnlijk probleem opgelost per kwartaal. Saai, samengesteld, echt. Het patroon bij klanten die falen: tien ambitieuze projecten gelanceerd in zes maanden, allemaal vastgelopen in pilot een jaar later.

Wat dit kost en hoe lang het duurt

Realistische vorm voor één end-to-end AI-implementatie op middelgrote schaal:

Discovery: 1–3 weken, €5K–€15K.
Shortlist: 1 week, inbegrepen in discovery.
Build: 4–10 weken, €30K–€120K afhankelijk van integraties.
Productie-hardening (parallel met build): inbegrepen.
Eerste iteratiecyclus: 8–12 weken na livegang, bescheiden interne tijd.

Totaal: een nuttig AI-systeem in productie binnen 8–14 weken na de start, voor €40K–€140K voor een typisch eerste project. Aanzienlijk sneller is meestal een dunne demo; aanzienlijk duurder is meestal scope creep.

Hoe wij werken

Wij helpen middelgrote bedrijven van AI-strategie naar productie-AI-systemen. We beginnen vrijwel altijd met een discovery van 1–3 weken, leveren een werkende eerste versie binnen 8–14 weken, en blijven betrokken voor de iteratiecycli die volgen. Meer over onze aanpak vind je op onze service-pagina's voor AI en AI agents.

Heb je een AI-strategie-slide die stof verzamelt? Beschrijf in een paar zinnen wat je zou willen ship'en via ons contactformulier — we reageren binnen één werkdag met een eerlijk oordeel waar te beginnen en wat het ongeveer kost.

Relevante pagina's

serviceAI-implementatie →Van AI-strategie naar productie met monitoring en evaluatie.serviceAI agents →Smalle, meetbare agents die een waardevolle taak betrouwbaar uitvoeren.