AI implementatie: van strategie naar productie in 5 stappen
Een opinionated routekaart in vijf stappen om AI van strategie-slide naar productiesysteem te brengen, zonder transformatieretoriek. Discovery, shortlist, build, productie, itereren.
De meeste AI-strategieën stranden in 2026 op hetzelfde punt: het gat tussen een AI-strategie-slide en een AI-systeem in productie. De slide is makkelijk. Het systeem is het werk. Dit artikel is een praktische, opinionated routekaart in vijf stappen om dat gat te overbruggen — geschreven voor technische en operationele beslissers die geen zin hebben in nóg een AI-workshop met dezelfde backlog als uitkomst.
We schrijven dit als softwareleverancier die middelgrote klanten van strategie naar een live AI-systeem brengt. We hebben projecten geleverd die werken. We hebben er ook genoeg zien falen. De vijf stappen hieronder vormen het verschil — en ze zijn ongeveer hetzelfde ongeacht bedrijfsgrootte.
De vijf stappen in één tabel
| Stap | Wat het is | Typische duur | Output |
|---|---|---|---|
| 1. Discovery | Het echte probleem scopen | 1–3 weken | Eén pijnlijke workflow, in kaart gebracht |
| 2. Shortlist | Kies 1–2 use cases, schrap de rest | 1 week | Eén bouwklare use case |
| 3. Build | Deterministische scaffolding + AI waar het zich verdient | 4–10 weken | Een werkend systeem |
| 4. Productie | Monitoring, evaluatie, human-in-the-loop | Doorlopend vanaf week één | Een betrouwbaar systeem |
| 5. Itereren | Meten, fixen, pas dan uitbreiden | Continu | Een systeem dat in de tijd beter wordt |
Stap 1 — Discovery: scope het echte probleem
AI-projecten falen vaker bij stap nul dan bij welke latere stap dan ook. De strategie-slide zegt "automatiseer klantenservice met AI" — het echte probleem is dat 30% van de inkomende mails duplicaten van FAQ-items zijn en het team de bestaande antwoorden niet snel genoeg vindt. Dat zijn verschillende problemen met verschillende oplossingen, en de tweede is degene die de moeite waard is.
Hoe ziet discovery er in de praktijk uit:
- Interview 3–7 stakeholders. Operations, support, het front-line team, IT. Niet alleen de executive sponsor.
- Breng de echte workflow op één pagina in kaart. Waar komt werk vandaan, wie raakt het aan, welke tools, waar stokt het?
- Identificeer de pijnlijke 80%. Het repetitieve, hoog-volume deel — niet de zeldzame, interessante edge case waar het team graag over praat.
- Negeer de AI-hype. Of het antwoord AI is, een Zapier-flow of een config-aanpassing in het bestaande CRM is een vraag voor stap 2. Stap 1 is alleen begrijpen.
Stap 2 — Shortlist: kies 1–2, schrap de rest
Discovery levert meestal 5–15 kandidaat use cases op. De verleiding is om ze allemaal te doen. Niet doen. Kies er één. Misschien twee als ze infrastructuur delen. Schrap de rest — voor nu.
Het 2x2 dat we gebruiken:
- Impact: hoeveel tijd/geld/foutreductie levert dit op als het werkt? In concrete eenheden, niet "groot".
- Haalbaarheid: is de data beschikbaar, is de workflow stabiel, is succes meetbaar, zijn stakeholders aligned?
Stop elke kandidaat in één van vier vakjes:
- Hoge impact, hoge haalbaarheid: ship dit. Dit is je eerste project.
- Hoge impact, lage haalbaarheid: park. Kom terug als de haalbaarheid verbetert (data, alignment, scope).
- Lage impact, hoge haalbaarheid: cool maar irrelevant. Schrap — de verleidelijke val van AI-projecten die makkelijk lijken.
- Lage impact, lage haalbaarheid: vanzelfsprekend schrappen.
Verbind je aan één pijnlijke, goed afgebakende job. "We brengen de tijd om inkomende vergunningsdocumenten te classificeren terug van 2 dagen naar 1 uur" is goed afgebakend. "We gaan AI gebruiken om operations te verbeteren" niet.
Stap 3 — Build: eerst deterministische scaffolding, dan AI waar het zich verdient
De grootste engineering-fout die we zien: een LLM in het centrum zetten van een workflow die het meeste niet nodig heeft. De meeste automatiserings-pipeline moet gewone code zijn — document ophalen, valideren, opslaan, routeren, notificatie versturen. De LLM is één node in de pipeline, niet de pipeline zelf.
Ons standaard buildpatroon:
- Bouw de scaffolding deterministisch. Workflow-engine (n8n is onze default), bron-connectors, downstream-acties, audit logging — dat is allemaal gewone software. Geen AI.
- Plug een LLM in waar die unieke waarde toevoegt. Vrij-tekst input classificeren. Velden uit rommelige documenten extraheren. Een antwoord opstellen dat een mens reviewt. Kiezen tussen branches die niet als regels zijn uit te drukken.
- Bouw de evaluatieset op dag één. Echte input + verwachte output voor 50–200 voorbeelden. Run de LLM-stap tegen die set bij elke prompt- of modelwijziging.
- Maak onzekerheid expliciet. De LLM moet kunnen zeggen "ik weet het niet" en doorzetten naar een mens. "Altijd antwoorden" is een bug, geen feature.
- Log elke stap. Inputs, outputs, de prompt, het model, de versie. Dat heb je nodig als er iets misgaat — en er gaat iets mis.
Bouwtijd voor een verstandig gescoopt eerste AI-project: 4–10 weken. Minder is meestal een dunne demo; meer is meestal scope creep.
Stap 4 — Productie: monitoring, evaluatie, human-in-the-loop waar nodig
Een AI-systeem in productie is niet hetzelfde artefact als het prototype. Het prototype werkt op de testdata. Productie moet werken op de input van morgen, en de dag erna, als iemand een proces stroomopwaarts aanpast en het je niet vertelt.
De vier productie-essentials:
Golden test set
Een gecureerde set van 50–200 representatieve, echte inputs met verwachte outputs. Elke modelwijziging, prompt-wijziging of dependency-wijziging draait eerst tegen deze set. Regresseert de kwaliteit, dan ship je niet. Dit is de meest hefboomrijke discipline in AI-werk.
Drift-monitoring
Volg de verdeling van inputs (lengtes, talen, brontypes) en outputs (zekerheidsscores, weigeringspercentages, downstream-acties). Verschuift de verdeling, dan is er stroomopwaarts iets veranderd — onderzoek vóór gebruikers het merken.
Escalatiepaden
Als het systeem niet zeker is, retrieval mist of een uitzondering vuurt — er is een mens die het krijgt, met een queue en een SLA. "Het routeert gewoon naar Slack" is geen escalatiepad; het is een garantie dat niemand reageert.
EU AI Act risicoclassificatie — vooraf
Vanaf 2 augustus 2026 geldt de EU AI Act volledig. Classificeer je systeem in de ontwerpfase, niet ná livegang. Voor de meeste middelgrote AI-systemen is de classificatie beperkt risico: vereist transparantie en een systeemregister, geen volledige conformiteitsbeoordeling. Hoog-risico systemen (HR, finance, veiligheidskritiek) vragen om aanzienlijk meer documentatie, monitoring en menselijk toezicht — bouw dat vanaf dag één in plaats van het er later op te plakken.
Stap 5 — Itereren: meten → verbeteren → uitbreiden
De verleiding na livegang is om aan het volgende project te beginnen. Hou je in voor 8–12 weken. De eerste versie heeft het over iets fout — meestal verschillende dingen — en de lessen uit het fixen daarvan zijn meer waard dan de volgende greenfield-build.
Hoe iteratie er in de praktijk uitziet:
- Meet wat je ship'te. Niet alleen "draait het systeem". Concrete unit-economics: tijd bespaard per case, foutpercentage, escalatieratio, gebruikerstevredenheid. De metric die je in stap 2 definieerde.
- Kijk naar foutpatronen, niet naar gemiddelden. Groepeer wat misgaat. Vijf terugkerende patronen zijn meer waard dan één samenvatting.
- Fix de patronen. Betere prompts, betere retrieval, betere escalatieregels, betere brondata. Soms zit de fix niet in de AI — maar in het stroomopwaartse proces.
- Pas dán uitbreiden. Als het eerste systeem zijn metric haalt en je de foutmodi begrijpt, is de volgende use case het juiste moment. Niet eerder.
Het patroon dat we zien bij klanten die het goed doen: één pijnlijk probleem opgelost per kwartaal. Saai, samengesteld, echt. Het patroon bij klanten die falen: tien ambitieuze projecten gelanceerd in zes maanden, allemaal vastgelopen in pilot een jaar later.
Wat dit kost en hoe lang het duurt
Realistische vorm voor één end-to-end AI-implementatie op middelgrote schaal:
- Discovery: 1–3 weken, €5K–€15K.
- Shortlist: 1 week, inbegrepen in discovery.
- Build: 4–10 weken, €30K–€120K afhankelijk van integraties.
- Productie-hardening (parallel met build): inbegrepen.
- Eerste iteratiecyclus: 8–12 weken na livegang, bescheiden interne tijd.
Totaal: een nuttig AI-systeem in productie binnen 8–14 weken na de start, voor €40K–€140K voor een typisch eerste project. Aanzienlijk sneller is meestal een dunne demo; aanzienlijk duurder is meestal scope creep.
Hoe wij werken
Wij helpen middelgrote bedrijven van AI-strategie naar productie-AI-systemen. We beginnen vrijwel altijd met een discovery van 1–3 weken, leveren een werkende eerste versie binnen 8–14 weken, en blijven betrokken voor de iteratiecycli die volgen. Meer over onze aanpak vind je op onze service-pagina's voor AI en AI agents.
Heb je een AI-strategie-slide die stof verzamelt? Beschrijf in een paar zinnen wat je zou willen ship'en via ons contactformulier — we reageren binnen één werkdag met een eerlijk oordeel waar te beginnen en wat het ongeveer kost.