Industrie

Zo bepaal je of je AI-experiment klaar is voor productie

· 10 min leestijd

Bijna de helft van alle AI-pilots in Nederlandse bedrijven bereikt nooit de productiefase, blijkt uit de McKinsey Global AI Survey van 2025. Het verrassende: in de meeste gevallen is de techniek niet het probleem. Het experiment werkt, de eerste resultaten zijn goed, het team is enthousiast. Maar niemand plant het moment waarop het team beslist: dit wordt nu een vast werkproces. In de AI-industrie is er al een term voor: pilot purgatory. Het vagevuur voor werkende experimenten die nooit standaard worden. Vier vragen die bepalen of jouw experiment die fase overleeft.

Kort antwoord

De meeste AI-experimenten stranden niet door technisch falen maar door vier ontbrekende voorwaarden: aantoonbare tijdwinst, overdraagbaarheid aan collega's, integratie in bestaande tools en een plan voor als het uitvalt. Stel deze vier vragen voordat je opschaalt.

Waarom stranden AI-experimenten na de eerste test?

Van de 42 procent Nederlandse bedrijven die AI gebruiken in 2026, heeft slechts 14 procent het volledig in productie geschaald. Dat blijkt uit onderzoek van Searchlab op basis van CBS- en McKinsey-data. De rest zit ergens tussen verkenning en pilot. Wereldwijd is het beeld vergelijkbaar: volgens McKinsey gebruikt 88 procent van de organisaties AI in minstens een bedrijfsfunctie, maar ziet slechts 39 procent daar meetbare impact op de winst van.

Vergelijk het met een stagiair die na drie maanden goed werk levert. Op een gegeven moment moet het bedrijf beslissen: nemen we deze persoon in vaste dienst, of niet? Bij AI-experimenten ontbreekt dat moment bijna altijd. Er is niemand die op de kalender zet wanneer het team evalueert of het experiment een vast werkproces wordt. Het experiment draait door, levert best iets op, maar groeit niet.

De vier vragen hieronder zijn die evaluatie. Ze kosten een halfuur en je kunt ze maandag stellen.

Bespaart het aantoonbaar tijd of geld?

"Het voelt sneller" is het vaakst gehoorde antwoord wanneer je vraagt wat een AI-experiment oplevert. Het is ook het gevaarlijkste antwoord. Een gevoel is geen businesscase. Een experiment dat je wilt opschalen moet aantoonbare resultaten hebben, gemeten in uren, euro's of foutpercentages.

De meting is eenvoudiger dan je denkt. Houd twee weken bij hoeveel tijd een taak kost zonder AI en twee weken met AI. Noteer het in een spreadsheet met drie kolommen: taaknaam, tijd zonder AI, tijd met AI. Overigens hoeft het resultaat niet spectaculair te zijn. Een maandafsluiting die van zes uur naar twee uur gaat bespaart vier uur per maand. Bij een gemiddeld uurtarief van vijftig euro is dat tweehonderd euro besparing. Trek daar een ChatGPT Team-abonnement van 23 euro per gebruiker per maand af en je houdt 177 euro netto over.

De rode vlag: als je na drie maanden experimenteren de besparing niet in een getal kunt uitdrukken, is het experiment niet klaar om te schalen. Misschien levert het op termijn iets op. Maar "op termijn" overleeft geen budgetgesprek.

Kan een collega het zonder jou?

De overdraagbaarheidstest is de meest onderschatte check. In veel bedrijven is het AI-experiment het project van een persoon, vaak degene die het meest enthousiast is over nieuwe technologie. Prima voor de pilotfase. Maar een werkproces dat afhankelijk is van een persoon is kwetsbaar. Het loopt vast zodra die persoon ziek is of met vakantie gaat.

De test is verrassend simpel. Schrijf je prompt en je werkwijze op in maximaal een A4. Geef het aan een collega die het experiment niet kent. Kan die persoon binnen tien minuten hetzelfde resultaat produceren? Zo ja: je experiment is overdraagbaar. Zo niet: er ontbreekt kennis die nog in jouw hoofd zit en niet in het proces.

Dit is ook het moment waarop een gedeelde AI-werkwijze binnen je team verschil maakt. Een persoon die AI gebruikt is een experiment. Drie collega's die dezelfde werkwijze volgen vormen samen een proces.

Draait het in je bestaande tools of ernaast?

Wacht even. Doe de kopieer-plak-test. Tel een dag lang hoe vaak je tekst kopieert vanuit ChatGPT of Claude naar een ander programma. Elke keer dat je kopieert en plakt, is een integratie die ontbreekt.

AI die naast je werkprocessen draait, als los tabblad in de browser, levert een fractie op van wat AI binnen je werkprocessen kan doen. Het verschil zit in context. Een AI-tool die los draait krijgt elke keer opnieuw uitleg over je bedrijf, je klanten en je werkwijze. Een AI-tool die in je CRM, je e-mailprogramma of je documentbeheer zit, heeft die context al.

Concreet: Perplexity werkt inmiddels vanuit Word en Excel. Microsoft 365 Copilot zit in Outlook, Teams en SharePoint. Claude en ChatGPT zijn via Zapier of Make te koppelen aan vrijwel elk bedrijfsproces. Soms is een koppeling van twintig minuten opzetten genoeg om de kopieer-plak-stap te elimineren.

Belangrijk voor het opschalen: als je experiment nog volledig via kopiëren en plakken werkt, investeer dan eerst in een integratie voordat je het uitrolt naar het hele team. Anders vermenigvuldig je de inefficiëntie in plaats van de waarde.

Wat gebeurt er als het een dag uitvalt?

Op 2 juni van dit jaar viel Claude uit. Ontwikkelaars die halverwege een klus zaten konden niet verder. Klantenservice-teams die hun AI-assistent gebruikten voor het samenvatten van gesprekken schakelden over op handmatig notuleren. Het was een nuttige stresstest.

Pas dit toe op jouw experiment. Wat gebeurt er als de AI-tool die je team gebruikt een dag niet beschikbaar is?

Er zijn twee antwoorden en beide zijn informatief. Als je team de schouders ophaalt en gewoon doorwerkt, is het experiment nog niet essentieel genoeg om vast werkproces te worden. Dat hoeft niet slecht te zijn. Misschien is het een handige aanvulling en geen kernproces. Maar schaal het dan ook niet op als kritieke infrastructuur.

Als je team vastloopt, is het experiment al kritieke infrastructuur, of je het zo noemt of niet. Dan heb je een noodplan nodig voordat je opschaalt. Welk alternatief pakken collega's als de tool uitvalt? Een grondige afhankelijkheidscheck helpt om die blinde vlekken te vinden voordat je hele afdeling ermee werkt.

Hoe scoor je op de vier vragen?

Hieronder staat een scorekaart. Loop de vier vragen langs voor je meest veelbelovende AI-experiment en geef elke vraag een kleur.

VraagGroenGeelRood
Bespaart het aantoonbaar?Meetbare besparing in uren of euro's"Het voelt sneller" maar geen dataGeen idee of het iets oplevert
Kan een collega het?Collega reproduceert het resultaatCollega heeft hulp nodigAlleen jij kunt het
In je tools of ernaast?Geïntegreerd of gekoppeldDeels handmatig kopiërenVolledig kopiëren en plakken
Noodplan bij uitval?Alternatief gedocumenteerdTeam weet wat te doen maar niet precies hoeNooit over nagedacht

Vier keer groen: je experiment is klaar om vast werkproces te worden. Plan het budget. ChatGPT Team kost 23 euro per gebruiker per maand, Claude Pro 20 euro, Microsoft 365 Copilot 28 euro. Schrijf de standaardprocedure uit en train het team.

Een of meer keer geel: los eerst die punten op. Geel wordt groen met een paar uur werk, meestal door het proces beter te documenteren of een koppeling op te zetten.

Een keer rood: het experiment is nog niet klaar. Dat is bruikbare informatie. Je weet nu precies wat er ontbreekt en je kunt gericht verbeteren in plaats van hopen dat het vanzelf gaat.

Wat moet je checken voor de AI Act bij opschalen?

Een praktische waarschuwing bij het opschalen. De AI Act maakt onderscheid tussen experimenteren en productiematig gebruik. Een AI-experiment dat je intern test met eigen data valt onder lichtere verplichtingen dan een werkproces dat klantdata verwerkt of beslissingen neemt over mensen.

Concreet: gebruik je AI in sollicitatieprocedures, creditscoring of klantbeoordeling? Dan geldt de toepassing als hoog risico zodra je het opschaalt en heb je een conformiteitsassessment nodig. Gebruik je AI voor interne werkprocessen zonder klantimpact, zoals het samenvatten van vergaderingen of het schrijven van rapporten? Dan zijn de verplichtingen een stuk lichter.

De hoofdregel: check voor je opschaalt of de toepassing onder de AI Act als hoog risico geldt. Bij twijfel helpt de DPIA-checklist van de Autoriteit Persoonsgegevens om dat vast te stellen.

Wat kun je hier maandag mee?

Kies je meest veelbelovende AI-experiment. Dat is waarschijnlijk het experiment waar je team het vaakst naar grijpt of het experiment waar jij zelf het meest enthousiast over bent. Loop de vier vragen langs. Vul de scorekaart in.

Scoor je vier keer groen? Blokkeer dan deze week een halfuur om de werkwijze op te schrijven voor een collega. Dat halfuur is het verschil tussen een experiment dat eindeloos in pilot purgatory hangt en een werkproces dat elke dag waarde levert voor je bedrijf.

Scoor je geel of rood? Dan weet je precies wat er ontbreekt. Geen vaag gevoel meer van "we moeten hier iets mee". Je hebt een concreet lijstje van wat er moet gebeuren voordat het experiment volwassen genoeg is voor de rest van het bedrijf.

En tot slot: de 74,6 procent van Nederlandse bedrijven die AI nog niet gebruiken, noemt volgens het CBS "gebrek aan ervaring" als belangrijkste reden. Dat is precies het gat dat een goed gedocumenteerd werkproces dicht. Jouw succesvol opgeschaald experiment wordt het bewijs dat AI bij jullie werkt, niet als demo, maar als dagelijkse praktijk.

Michael Groeneweg
Geschreven door Michael Groeneweg AI-consultant bij Digital Impact en oprichter van UnicornAI.nl

Michael is AI-consultant bij Digital Impact in Rotterdam en oprichter van UnicornAI.nl, waar hij AI-oplossingen en SaaS-integraties bouwt voor bedrijven. Al tien jaar ondernemer, en sinds een paar jaar weigert hij iets te doen waar geen AI in verweven zit, zakelijk noch privé, tot mild ongenoegen van zijn omgeving. Zijn reizen door de wereld zijn inmiddels een serie experimenten in wat AI wel en niet kan vanaf een terrasje in Lissabon of een treinstation in Tokio. Hij test obsessief nieuwe tools, bouwt oplossingen voor klanten, en vindt dat niemand de hype moet geloven, maar ook niemand meer kan doen alsof AI niet alles verandert. Houdt van goede koffie, lange vluchten en mensen die met AI bouwen in plaats van er alleen over praten.

Gemaakt door een mens, met AI als assistent bij research en redactie. Meer over onze werkwijze in de AI-disclosure en het redactiestatuut.