Claude Fable werkte 9,5 uur zelfstandig en leverde complete software
Large Language Models

Claude Fable werkte 9,5 uur zelfstandig en leverde complete software

· 8 min leestijd

Een AI die negen en een half uur onafgebroken doorwerkt aan één opdracht en software aflevert waar onderzoekers al jaren op wachten. Geen demo van Anthropic zelf, maar de ervaring van Wharton-professor Ethan Mollick, die al weken vóór de lancering met Claude Fable 5 mocht werken. Zijn verslag is de eerste serieuze praktijktest van een Mythos-model. En het laat vooral zien hoe jouw eigen rol verandert zodra dit soort AI je bedrijf binnenkomt: je stuurt niet meer, je geeft opdracht.

Wat heeft Fable in die test gebouwd?

In Mollicks experimenten bouwde Fable 5 onder meer een interactieve reiskaart op basis van ruim 2.200 echte vluchten, drie speelbare games en complete onderzoekssoftware. Mollick beschrijft de test deze week op zijn blog One Useful Thing, een van de meest gelezen AI-nieuwsbrieven ter wereld.

Het opvallendste experiment is een zogeheten isochronenkaart, een kaart die laat zien hoe ver je binnen een bepaalde reistijd komt. De eerste werd in 1881 met de hand getekend vanuit Londen. Mollick vroeg Fable om een moderne, interactieve versie op basis van echte reisdata. Één ambitieuze briefing, meer niet.

De originele isochronenkaart uit 1881 met reistijden vanuit Londen
De originele isochronenkaart uit 1881, het startpunt van Mollicks opdracht. Bron: One Useful Thing, 9 juni 2026.

Wat er daarna gebeurde, is het lezen waard. Fable startte zelfstandig meerdere goedkopere Claude Sonnet-modellen op als hulptroepen. Die zochten vluchtschema's op, treintijden van de TGV tot de Shinkansen, en gemiddelde rijsnelheden per land uit wetenschappelijke studies. Ondertussen begon het hoofdmodel alvast met programmeren, en zette het weer andere agents in om de eigen code te testen.

Toen Mollick klaagde dat afgelegen gebieden zoals Groenland nog schattingen bevatten, zette Fable een tandje bij. Het model zocht uit hoe vaak er schepen varen naar Pitcairn, een eiland met vijftig inwoners midden in de Stille Oceaan. De kaart staat online, inclusief bronnen en uitleg van de aanpak.

Overigens maakte Fable in dezelfde testperiode ook een indrukwekkend rijmgedicht van tien pagina's waarin elk woord met een s begint. En drie speelbare games, waaronder een kaartspel rond muntjes opgooien geïnspireerd op Balatro. Omdat Claude geen afbeeldingen kan genereren, maakte het model alle beelden met pure wiskunde. Niemand had daar zo om gevraagd, het kon gewoon.

Negen en een half uur zonder pauze

Het ambitieuste project was onderzoekssoftware die Fable zelf de naam Concord gaf. Mollick legde het model een probleem voor waar sociale wetenschappers al jaren mee worstelen: hoe vergelijk je menselijke beoordelingen met AI-beoordelingen op een statistisch verantwoorde manier?

Fable schreef eerst een ontwerpdocument van 19 pagina's. Daarna ging het aan het werk. Negen en een half uur lang, zonder tussenstop.

Screenshot van Concord, de onderzoekssoftware die Claude Fable 5 in 9,5 uur bouwde
Concord, de software die Fable in één sessie van 9,5 uur bouwde. Bron: One Useful Thing, 9 juni 2026.

Het resultaat: werkende software die datasets inleest, menselijke en AI-oordelen met elkaar vergelijkt en daar analyses op draait. Volgens Mollick precies het gereedschap dat onderzoekers al jaren nodig hebben, maar dat nooit werd gebouwd omdat er geen commerciële markt voor is. Hij vond als vakexpert nog fouten en ontbrekende onderdelen die hij liet corrigeren, maar de omvang van wat er stond overtrof alles wat hij eerder van AI had gezien. De code staat openbaar op GitHub.

Waarom voelt dit anders dan ChatGPT gebruiken?

Het verschil zit niet in de kwaliteit van de antwoorden, maar in de werkrelatie. Vorig jaar vergeleek Mollick het werken met AI nog met een tovenaar: je spreekt een spreuk uit en er gebeurt iets. Bij Fable klopt dat beeld niet meer, schrijft hij, omdat het model zelf een compleet team van agents opstart dat onderzoekt, schrijft en elkaars werk controleert.

"Een opdrachtgever huurt één kunstenaar in. Fable is eerder een complete studio, waarin jij de klant bent die het eindresultaat goedkeurt zonder ooit een voet op de werkvloer te zetten."

Ethan Mollick, One Useful Thing

Even voor de beeldvorming: dit is alsof je een verbouwing aan een aannemer gunt. Je beschrijft wat je wilt, je betaalt, en je beoordeelt het eindresultaat. Maar welke onderaannemers er rondlopen, welke keuzes er op dinsdag zijn gemaakt en waarom de leidingen links liggen in plaats van rechts, dat zie je niet. Mollick noemde zijn ervaring "iets tussen heerlijk en verontrustend in". Heerlijk omdat hij iets vroeg en het gebeurde. Verontrustend om precies dezelfde reden.

Het werk verschuift daarmee van proces naar uitkomst. Honderden kleine beslissingen worden genomen zonder dat je er een stem in hebt. Bijsturen kan achteraf, meekijken niet.

Wat betekent dit voor jouw bedrijf?

De grootste verschuiving is dat maatwerksoftware die nooit rendabel was om te laten bouwen, ineens binnen bereik komt. Concord is daar het bewijs van: software waarvoor de markt te klein is, maar die voor één organisatie veel waarde heeft.

Vrijwel elk bedrijf heeft zo'n lijstje liggen. Denk aan een administratiekantoor dat al jaren een eigen controletool wil die precies bij de eigen werkwijze past. Een logistiek bedrijf met een planningspuzzel waar standaardpakketten net niet op passen. Een marketingbureau dat rapportages uit zes systemen handmatig samenvoegt. Voor zulke interne tools was een ontwikkeltraject van tienduizenden euro's nooit te verantwoorden. Een briefing aan een Mythos-model kost een fractie daarvan.

Daar staat een nieuwe vaardigheid tegenover. Wie het meeste uit Fable haalde, schreef geen losse prompts maar complete briefings met doel, context en duidelijke eisen. Mollick formuleert het scherp: hoe ambitieuzer de instructie, hoe beter het resultaat. Dat is een omkering van hoe de meeste organisaties nu met AI werken, voorzichtig en in kleine stapjes, zoals beschreven in de acht niveaus van AI-gebruik.

En er komt een tweede vaardigheid bij: beoordelen. Mollick vond de fouten in Concord omdat hij zelf vakexpert is. Wie AI-werk niet kan controleren, tekent blind bij het kruisje. Het beoordelingsproces dat je nu hebt voor extern bureauwerk, heb je straks nodig voor AI-opdrachten.

Opvallend genoeg verwacht Mollick daarom eerder meer vraag naar programmeurs dan minder. Iemand moet de laatste bugs eruit halen die de opdrachtgever zelf niet snel vindt, en de stortvloed aan nieuwe software die hierdoor ontstaat moet ook onderhouden worden. De rol verschuift van bouwen naar afmaken en bewaken.

De kosten en het gebrek aan controle

Fable is per token twee keer zo duur als Claude Opus, en het verbruikt er tijdens zo'n lange werksessie enorm veel. Mollicks droge samenvatting van de productiekosten: "veel". Al tekent hij daarbij aan dat het model slim werk uitbesteedt aan goedkopere Sonnet-modellen, wat de echte prijs flink kan drukken. Voor wie wil rekenen: de specs en prijzen staan in onze model-tracker, en de achtergrond van de lancering in ons artikel over Fable 5 en Mythos 5.

De beveiligingsregels zijn streng. Bij het minste vermoeden van een beveiligingskwestie schakelt het systeem terug naar het minder krachtige Claude Opus 4.8, en volgens Mollick gebeurt dat veel te vaak. Cybersecurity-werk is daardoor met Fable praktisch onmogelijk, een bewuste keuze van Anthropic die we eerder beschreven in het stuk over Anthropics eigen waarschuwingen.

Wacht even, want er is ook een grappig detail. De software die Fable schrijft, bevat dezelfde stijltrekjes als Claudes teksten. Mollick herkende in de code en in de voortgangsrapporten dezelfde typische Claude-zinnen, door hem "Claudisms" gedoopt. Zelfs een AI-studio heeft blijkbaar een huisstijl.

Een serieuzer punt is de zwarte doos. Je ziet niet welke afwegingen het model maakt, welke bronnen het kiest of waarom het voor een bepaalde aanpak gaat. Voor een interne tool is dat te overzien. Voor processen met klantdata of compliance-eisen is dat een belangrijke vraag om vooraf te beantwoorden.

Waar gaat Mythos heen?

Mollick schetst twee scenario's. In het eerste scenario komen er betere interfaces die je laten meekijken en tussendoor laten bijsturen; het verlies aan controle is dan tijdelijk. In het tweede scenario hoort de zwarte doos er gewoon bij: hoe beter het model, hoe minder er in het proces voor een mens te doen valt. Mollick verwacht het tweede.

Voor de richting van AI-werk is dat een belangrijk signaal. De afgelopen twee jaar draaide werken met AI om chatten, prompts verbeteren en losse taken versnellen. Mythos-modellen wijzen naar een fase waarin je werk uitbesteedt aan AI zoals je het aan een bureau uitbesteedt, inclusief briefing, deadline en oplevering. Wie alleen heeft geleerd te chatten, mist die slag.

Wat kun je hier morgen mee?

Je hoeft geen Fable-toegang te hebben om je hierop voor te bereiden. Drie dingen die je deze week kunt doen:

  • Maak het lijstje van software die er nooit kwam. Welke interne tool wilde je team altijd al, maar was te duur om te laten bouwen? Dat lijstje is straks je opdrachtenboek.
  • Oefen met briefings in plaats van prompts. Schrijf één ambitieuze opdracht uit met doel, eisen en een deadline, en kijk hoe ver Claude Code er nu al mee komt. De werkwijze met zelfstandige agents is daar vandaag al zichtbaar.
  • Regel je beoordelingsproces. Spreek af wie het werk van AI beoordeelt en waarop, precies zoals bij een externe leverancier. Mollick had zijn fouten binnen een uur gevonden, maar alleen omdat hij wist waar hij moest kijken.

De vraag is niet meer of AI het werk aankan, maar of jouw organisatie al weet hoe je een goede opdrachtgever bent. Wil je dit soort verschuivingen dagelijks volgen? Schrijf je in voor onze gratis AI-nieuwsbrief.

Michael Groeneweg
Geschreven door Michael Groeneweg AI-consultant bij Digital Impact en oprichter van UnicornAI.nl

Michael is AI-consultant bij Digital Impact in Rotterdam en oprichter van UnicornAI.nl, waar hij AI-oplossingen en SaaS-integraties bouwt voor bedrijven. Al tien jaar ondernemer, en sinds een paar jaar weigert hij iets te doen waar geen AI in verweven zit, zakelijk noch privé, tot mild ongenoegen van zijn omgeving. Zijn reizen door de wereld zijn inmiddels een serie experimenten in wat AI wel en niet kan vanaf een terrasje in Lissabon of een treinstation in Tokio. Hij test obsessief nieuwe tools, bouwt oplossingen voor klanten, en vindt dat niemand de hype moet geloven, maar ook niemand meer kan doen alsof AI niet alles verandert. Houdt van goede koffie, lange vluchten en mensen die met AI bouwen in plaats van er alleen over praten.

Gemaakt door een mens, met AI als assistent bij research en redactie. Meer over onze werkwijze in de AI-disclosure en het redactiestatuut.