Industrie

Medeoprichter van OpenAI stapt over naar Anthropic om Claude te trainen

· 8 min leestijd

Een van de elf mensen die OpenAI ooit oprichtten, werkt sinds deze week voor de concurrent. Andrej Karpathy, de AI-onderzoeker die Tesla leerde zelf te rijden en daarna miljoenen ontwikkelaars AI bijbracht via YouTube, kondigde vandaag aan dat hij bij Anthropic aan de slag gaat. Niet zomaar ergens op de gang, maar in het pre-trainingteam dat bepaalt hoe slim Claude wordt. Zijn opdracht: Claude inzetten om Claude zelf sneller te verbeteren. Dat de man die ChatGPT mede mogelijk maakte nu voor de rivaal kiest, zegt iets over waar het zwaartepunt in AI-onderzoek verschuift.

Wie is Andrej Karpathy?

Karpathy is een van de meest invloedrijke AI-onderzoekers van dit moment, en dat is niet overdreven. Hij was een van de oorspronkelijke elf medeoprichters van OpenAI in 2015. Daarna leidde hij de Autopilot-afdeling bij Tesla, waar hij de computer vision-systemen bouwde die de auto's zelfstandig leren navigeren. In 2023 keerde hij kort terug naar OpenAI, maar vertrok opnieuw in 2024.

Sindsdien werd hij een soort volksuniversiteit voor AI. Zijn YouTube-cursus "Neural Networks: Zero to Hero" is voor duizenden developers de eerste kennismaking met hoe grote taalmodellen werken. Hij richtte Eureka Labs op, een startup die AI wil inzetten in het onderwijs. En hij bleef publiekelijk experimenteren met frontier-modellen, tot het punt dat hij zichzelf omschreef als "in een staat van AI-psychose" sinds december.

Even voor de beeldvorming: dit is alsof de hoofdarchitect van de eerste iPhone besluit om bij Samsung te gaan werken. Niet omdat Apple slecht is, maar omdat hij denkt dat het echte werk nu daar gebeurt.

Waarom koos hij voor Anthropic en niet voor OpenAI?

Karpathy had terug kunnen gaan naar OpenAI. Hij is medeoprichter. De deur stond open. Maar hij koos bewust voor de concurrent. Dat is opmerkelijk.

"I think the next few years at the frontier of LLMs will be especially formative," schreef Karpathy in zijn aankondiging op X. "I am very excited to join the team here and get back to R&D."

Die laatste drie woorden zijn veelzeggend. "Get back to R&D." Bij OpenAI is de focus de afgelopen twee jaar steeds meer verschoven naar productontwikkeling, partnerships en commercie. Bij Anthropic ligt de nadruk nog nadrukkelijk op onderzoek. Karpathy kiest voor het lab, niet voor het platform.

Dat is geen geheim. OpenAI bouwt een advertentieplatform, lanceert financiele features in ChatGPT en onderhandelt over miljardenwaarderingen. Anthropic publiceert ondertussen papers over AI-veiligheid en investeert in fundamenteel modelonderzoek. Voor een onderzoeker als Karpathy is die keuze logisch.

Wat gaat hij precies doen bij Claude?

Karpathy start in het pre-trainingteam onder leiding van Nick Joseph. Pre-training is het proces waarbij Claude zijn basiskennis en vaardigheden krijgt, de fase waarin het model leert denken. Het is de duurste en meest rekenintensieve stap in het bouwen van een frontier-model.

Maar hier wordt het pas echt interessant. Karpathy gaat een nieuw team leiden dat Claude inzet om het pre-trainingproces zelf te versnellen. Claude dat zichzelf helpt verbeteren. Dat klinkt als science fiction, maar het is de richting waar alle grote AI-labs naartoe bewegen.

Overigens was Karpathy recent nog sceptisch over AI-agents die code schrijven. Een paar maanden later beschreef hij zichzelf als "blown away" door de voortgang. Die draai van criticus naar enthousiasteling verklaart waarom hij nu precies in dit domein wil werken.

Claude verbetert Claude, hoe werkt dat?

Pre-training kost honderden miljoenen dollars per run. Elke verbetering in efficientie bespaart direct geld en levert sneller betere modellen op. Als je Claude kunt inzetten om patronen te vinden in trainingsdata, om hyperparameters te optimaliseren of om experimentresultaten te analyseren, versnelt dat het hele ontwikkelproces.

Denk aan een architect die zijn eigen tekensoftware bouwt. Elke verbetering aan het gereedschap maakt het volgende ontwerp beter en sneller. Dat is wat Karpathy's team gaat doen, maar dan voor het trainen van AI-modellen.

Dit is wat analisten omschrijven als "de steeds belangrijker wordende frontier": AI-bedrijven die de race willen winnen, zetten hun eigen modellen in om het onderzoeksproces te versnellen. Niet meer compute kopen, maar slimmer onderzoek doen. Anthropic gelooft dat dit het verschil maakt ten opzichte van OpenAI en Google.

Wat betekent dit voor de AI-talentenstrijd?

De AI-industrie vecht op drie fronten tegelijk: geld, rekenkracht en talent. Van die drie is talent het schaarsst. Je kunt altijd meer GPU's kopen. Toponderzoekers die begrijpen hoe je een frontier-model traint, kun je niet bijdrukken.

Karpathy is niet zomaar een goede onderzoeker. Hij overbrugt de kloof tussen theorie en praktijk als bijna niemand anders. Hij kan een paper over attention-mechanismen uitleggen aan een miljoenenpubliek op YouTube en tegelijkertijd de trainingspipeline van een model van honderden miljarden parameters leiden.

Dat Anthropic hem binnenhaalt, en dat hij bewust niet terugkeert naar OpenAI, is een signaal. Het bedrijf achter Claude trekt steeds vaker de beste mensen aan. Vorige week werd bekend dat KPMG Claude uitrolt onder zijn 276.000 medewerkers in 138 landen. Uit data van Ramp blijkt dat inmiddels meer bedrijven voor Claude kiezen dan voor ChatGPT. Dit past in dat patroon.

Wie is er nog meer aangenomen?

Tegelijk met Karpathy meldde Anthropic dat Chris Rohlf is toegetreden tot het frontier red team. Rohlf brengt meer dan twintig jaar cybersecurity-ervaring mee van Yahoo, Meta en Georgetown's Center for Security and Emerging Technology. Zijn taak: de veiligheid van Claude's meest geavanceerde modellen testen voordat ze worden uitgebracht.

Twee aannames op een dag. Een toponderzoeker voor de intelligentie, een beveiligingsexpert voor de veiligheid. Dat is geen toeval.

Wat merk je hier als Claude-gebruiker van?

Op korte termijn niets. Karpathy begint net en pre-training is een proces van maanden. Maar op de middellange termijn is dit relevant als je Claude gebruikt voor je werk.

Als je een Claude Pro-abonnement hebt van twintig euro per maand, of je team draait op Claude for Business, dan profiteer je straks van modellen die sneller en efficinter zijn getraind. Betere antwoorden, minder fouten, meer begrip van complexe taken. Dat is wat een sterker pre-trainingteam uiteindelijk oplevert.

Voor Nederlandse bedrijven die twijfelen tussen ChatGPT en Claude is dit een extra datapunt. De mensen die letterlijk hebben meegebouwd aan ChatGPT kiezen er nu voor om aan Claude te werken. Dat zegt iets over waar zij de toekomst zien.

Karpathy voegde nog toe dat hij "deeply passionate" blijft over onderwijs en zijn werk daaraan wil hervatten wanneer de tijd rijp is. Zijn YouTube-kanaal en Eureka Labs verdwijnen dus niet. Maar de prioriteit is duidelijk: eerst Claude beter maken.

Wie weet staat er over een jaar een model in onze model tracker met Karpathy's vingerafdrukken erop. Voor nu is het simpel: de man die Tesla leerde rijden, gaat Claude leren denken.

Michael Groeneweg
Geschreven door Michael Groeneweg AI-consultant bij Digital Impact en oprichter van UnicornAI.nl

Michael is AI-consultant bij Digital Impact in Rotterdam en oprichter van UnicornAI.nl, waar hij AI-oplossingen en SaaS-integraties bouwt voor bedrijven. Al tien jaar ondernemer, en sinds een paar jaar weigert hij iets te doen waar geen AI in verweven zit, zakelijk noch privé, tot mild ongenoegen van zijn omgeving. Zijn reizen door de wereld zijn inmiddels een serie experimenten in wat AI wel en niet kan vanaf een terrasje in Lissabon of een treinstation in Tokio. Hij test obsessief nieuwe tools, bouwt oplossingen voor klanten, en vindt dat niemand de hype moet geloven, maar ook niemand meer kan doen alsof AI niet alles verandert. Houdt van goede koffie, lange vluchten en mensen die met AI bouwen in plaats van er alleen over praten.

Gemaakt door een mens, met AI als assistent bij research en redactie. Meer over onze werkwijze in de AI-disclosure en het redactiestatuut.