The Thinking Game: Een mooie documentaire over zelflerende kunstmatige intelligentie.

Kan een computer zichzelf aanleren hoe ie Pong, Breakout of Pac-Man kan spelen? Van grootmeesters kan winnen bij schaken of go? Of kan voorspellen hoe ingewikkelde eiwitten opgevouwen zijn?

De bekroonde documentaire “The Thinking Game”, geselecteerd voor het prestigieuze Tribeca Film Festival, vertelt het verhaal van DeepMind, het Britse bedrijf dat enkele van de meest baanbrekende doorbraken in AI heeft gerealiseerd. Maar meer nog: het is een menselijk verhaal over dromen, doorzettingsvermogen en de vraag wat er gebeurt wanneer machines leren om zichzelf te verbeteren.

Van simpele spelletjes naar wereldveranderende wetenschap

Het verhaal begint in 2013, met het spelen van het jaren ’80 Atari-spelletje Pong. Een simpel spel waarbij je een balletje heen en weer slaat met een digitaal batje. Het DeepMind-team bouwde een systeem dat dit spel moest leren spelen zonder regels of uitleg. Het systeem kreeg alleen te zien wat er op het scherm gebeurde en kreeg punten als beloning.

De eerste weken waren frustrerend. Het systeem deed maar wat, miste de bal, verloor. Het team begon te twijfelen: “Misschien hebben we het gewoon mis. We kunnen niet eens Pong aan.” Maar toen gebeurde er iets magisch. Plotseling begon het systeem punten te scoren. Niet één keer per ongeluk, maar steeds vaker. Het had zichzelf geleerd hoe het batje moest bewegen om de bal te raken. Drie maanden later kon geen enkele mens het nog verslaan.

Dit is de essentie van zelflerend AI: systemen die door trial and error - net als kinderen die leren lopen - zichzelf vaardigheden aanleren. Tijdens de trainingsfase spelen deze systemen miljoenen potjes tegen zichzelf, maken fouten, ontdekken wat werkt en wat niet, en worden steeds beter. Het is een prachtig proces om te zien, omdat het zo natuurlijk aanvoelt, zo menselijk bijna.

De Go-wedstrijd die de wereld veranderde

De echte doorbraak kwam met AlphaGo, het systeem dat het eeuwenoude bordspel Go leerde spelen. Go geldt als het meest complexe bordspel ter wereld - er zijn meer mogelijke bordconfiguraties dan er atomen in het heelal zijn. Generaties AI-onderzoekers hadden gezegd: “Dit kunnen computers nooit leren.”

In 2016 ging AlphaGo de strijd aan met Lee Sedol, een van de beste Go-spelers ter wereld, omschreven als “de Roger Federer van Go”. Tijdens de eerste wedstrijd speelde AlphaGo zet 37 - een zet die geen enkele menselijke speler ooit zou hebben gedaan. Professionele commentatoren waren verbijsterd. AlphaGo berekende later dat de kans dat een mens deze zet zou spelen 1 op 10.000 was.

Die zet was briljant. Het systeem had, door miljoenen keren tegen zichzelf te spelen tijdens de training, een compleet nieuwe strategie ontdekt. Een strategie die in duizenden jaren Go-geschiedenis nooit was bedacht. Lee Sedol gaf op. Het was een historisch moment.

Maar het verhaal werd nog indrukwekkender. Het team ontwikkelde AlphaGo Zero - een versie die helemaal niet meer trainde op menselijke partijen. Het kreeg alleen de regels en mocht tegen zichzelf spelen. In één dag tijd, tussen het ontbijt en het avondeten, ontwikkelde het zich van totale beginner tot het sterkste Go-programma ooit. Het had zichzelf niet alleen geleerd hoe je Go speelt, maar ontdekte strategieën die mensheid in millennia niet had gevonden.

Het verschil met jouw ChatGPT

Belangrijk om te begrijpen: de AI-assistenten die jij dagelijks gebruikt - ChatGPT, Claude, Gemini en andere - zijn ook zelflerende systemen geweest, maar alleen tijdens hun ontwikkeling. Ze hebben maandenlang getraind op miljarden teksten, hebben patronen geleerd, taal begrepen, en zijn steeds beter geworden in het beantwoorden van vragen.

Maar zodra ze ‘klaar’ zijn en beschikbaar komen voor gebruik, stopt dat leerproces. De AI-modellen van ChatGPT, Claude, Gemini en andere worden immers door miljoenen personen gebruikt, en je wilt natuurlijk niet dat iedere gebruiker de ervaring van elke andere beïnvloedt.

De systemen in de documentaire daarentegen - zoals AlphaGo Zero - bleven zichzelf trainen, dag en nacht, steeds beter wordend. Dat is een cruciaal verschil. Het laat ook zien waarom de doorbraken van DeepMind zo bijzonder zijn: ze hebben laten zien wat er mogelijk is tijdens die intensive trainingsfase, wanneer een systeem miljoenen keer kan experimenteren en van zijn fouten kan leren.

Van games naar het redden van levens

Het mooiste deel van het verhaal komt wanneer DeepMind deze zelfde principes toepast op wetenschappelijk onderzoek. Ze richtten zich op het “eiwitvouwprobleem” - een van de grootste mysteries in de biologie.

Eiwitten zijn de bouwstenen van het leven. Ze bepalen hoe ons lichaam functioneert, van onze spieren tot ons immuunsysteem. Wetenschappers wisten al decennia dat als je de structuur van een eiwit kent, je ziektes beter kunt begrijpen en behandelen. Maar het bepalen van die structuur was ontzettend moeilijk en tijdrovend - vaak kostte het maanden of jaren om één enkel eiwit te ontrafelen.

Het team bouwde AlphaFold, een systeem dat leerde om van de aminozuurvolgorde (de ingrediënten van een eiwit) de driedimensionale structuur te voorspellen. De eerste poging was teleurstellend. Ze wonnen wel de wetenschappelijke competitie, maar de resultaten waren niet goed genoeg om echt nuttig te zijn voor biologen. Het voelde als een nederlaag.

Maar ze gaven niet op. Ze herschreven het hele systeem, voegden nieuwe inzichten toe, lieten het opnieuw trainen. En toen kwam de doorbraak. AlphaFold 2 loste het eiwitvouwprobleem op - een probleem waar wetenschappers vijftig jaar aan hadden gewerkt. Een professor in de documentaire zegt ontroerd: “Dit is een probleem waarvan ik nooit had gedacht de oplossing ooit zelf mee zou kunnen maken.”

Maar hier wordt het verhaal echt mooi: DeepMind besloot alle voorspellingen gratis beschikbaar te maken. Ze berekenden de structuur van 200 miljoen eiwitten en gaven deze weg aan de hele wereld. Geen patent, geen commerciële uitbuiting, gewoon een cadeau aan de mensheid. Wetenschappers wereldwijd kunnen nu binnen seconden de structuur van een eiwit opzoeken die anders jaren zou hebben gekost om te bepalen.

De verantwoordelijkheid die erbij komt

De documentaire verzwijgt ook de schaduwkanten niet. De oprichter van DeepMind, Demis Hassabis, wordt vergeleken met Robert Oppenheimer - de man achter de atoombom. Er zijn zorgen over militaire toepassingen, over snellere oorlogen dan mensen kunnen bevatten, over surveillance en machtsmisbruik.

Maar wat indruk maakt, is hoe serieus het team deze zorgen neemt. Ze bedingen bij hun overname door Google dat hun technologie niet voor militaire doeleinden gebruikt mag worden. Ze pleiten voor internationale samenwerking en regelgeving. “We kunnen niet eerst bouwen en dan later repareren wat kapot gaat,” zegt iemand in de film. “Je krijgt maar één kans om het goed te doen.”

Het is een belangrijke les: technologie is niet neutraal. Hoe we het bouwen, wie het controleert, voor welke doeleinden we het inzetten - dat zijn keuzes die we nu maken en die onze toekomst vormgeven.

Wat betekent dit voor ons?

Deze documentaire laat zien dat zelflerende systemen, wanneer ze goed worden ontwikkeld en ingezet, een enorme kracht voor goed kunnen zijn. Ze kunnen wetenschappelijke problemen oplossen die generaties onderzoekers voor onmogelijk hielden. Ze kunnen nieuwe inzichten ontdekken die buiten het bereik van menselijk denken liggen.

Voor ouders en docenten biedt het een venster in de wereld waarin onze kinderen opgroeien - een wereld waarin AI niet langer sciencefiction is, maar een werktuig dat onze samenleving transformeert. Voor medewerkers en zzp-ers laat het zien dat we niet bang hoeven te zijn voor AI, maar dat we moeten begrijpen hoe het werkt en hoe we het verantwoord kunnen inzetten.

Het mooiste moment in de documentaire is misschien wel wanneer een teamlid zegt: “Op het moment dat AlphaFold beschikbaar kwam voor de wereld, waren wij niet langer de belangrijkste mensen in het AlphaFold-verhaal.” De echte impact begint pas wanneer duizenden wetenschappers deze tools gebruiken voor hun onderzoek naar ziektes, klimaatverandering en duurzame energie.

Een hoopvol toekomstbeeld

“The Thinking Game” is uiteindelijk een hoopvol verhaal. Het laat zien dat als we slimme, toegewijde mensen samenbrengen met krachtige technologie en een duidelijk doel - het oplossen van de belangrijkste problemen van de mensheid - we ongelooflijke dingen kunnen bereiken.

De documentaire eindigt met de belofte dat we aan het begin staan van iets groots. Niet omdat machines de mens gaan vervangen, maar omdat ze ons kunnen helpen om verder te kijken, dieper te begrijpen, sneller oplossingen te vinden voor problemen die ons allemaal aangaan.

Het is een verhaal dat iedereen moet zien die zich afvraagt: waar gaat dit allemaal naartoe met AI? Het antwoord is niet simpel, maar het kan wel heel mooi zijn - als we de juiste keuzes maken.