Column # 4 - Alpha aapje
December is altijd een beetje een vreemde maand. Vage nostalgische gedachten worden vakkundig weggezopen en het lege gevoel in je maag efficiënt weggewerkt met herten of ganzen. Intussen komen we samen met diegenen die we normaal gesproken zoveel mogelijk vermijden; onze familie. Een maand van tegenstrijdigheden dus, en dat gold deze december zeker ook voor de schaakwereld. Terwijl in Londen tijdens de Chess Classis de beste schakers ter wereld de ene na de andere remise speelden, versloeg ergens op het internet of in de cloud AlphaZero op meedogenloze wijze de tot nu toe beste schaakcomputer ter wereld, Stockfish.
Zo geestdodend als de partijen van de mensen waren, zo opwindend waren de kunststukjes van AlphaZero. Terwijl Magnus Carlsen met zijn slechtste partij in jaren, die tegen Ian Nepomniachtchi, bewees een sterveling te zijn, werd Alpha Zero 'buitenaards' en 'alien' genoemd. Andere commentatoren vonden juist dat Alpha (ik mag Alpha zeggen) heel 'menselijk' speelde, waarmee werd aangetoond dat niemand precies wist wat hier gebeurde. Over één ding waren de kenners het eens: zoiets was nog nooit vertoond.
Even de feiten op een rij. AlphaZero speelde honderd potjes tegen Stockfish, verloor er nul, remiseerde er 72 en won er 28. De beste tien winstpartijen werden door Google, eigenaar van DeepMind, ontwikkelaar van Alpha, gepubliceerd. Alpha kende aanvankelijk alleen de regels, speelde een paar oefenpotjes tegen zichzelf, om nog geen 24 uur later Stockfish een pak op de broek te geven. Het verschil tussen de twee: volgens Google rekende Alpha 80.000 stellingen per seconde uit, tegen Stockfish 70 miljoen. Artificial Intelligence tegenover simpele computerprogrammeurs, evaluatie contra diep rekenen, subtiliteit wint het van brute kracht.
Mijn eerste reactie was: waarom schaken wij mensen eigenlijk nog? Waarom stoppen we niet met de zelfkwelling en stress? Waarom organiseren we niet uitsluitend computerschaaktoernooien? Je laat computers duizenden malen tegen elkaar spelen en kiest de mooiste partijen uit. Vervolgens laat je de mensen de partijen becommentariëren, zodat Maurice Ashley niet zonder werk komt te zitten. We besparen ons de zouteloze interviewtjes met de topschakers waarin in haast onverstaanbaar gemompel vage excuses worden aangehaald voor hun snelle remises en onbegrijpelijke computervarianten worden gerecycled. Bovendien zeuren schaakcomputers niet om startgeld of condities. (Dat laatste is overigens niet geheel waar. Zo heb ik uit betrouwbare bron vernomen dat Stockfish tijdens het laatste computertoernooi 77 zakken M&M's eiste, met alleen maar blauwe exemplaren. En van Rybka is bekend dat z’n roomservice-rekening de pan uitrijst door eindeloze bestellingen van kaviaar, vodka en champagne. Hij liet z'n hotelkamer vervolgens achter alsof Motörhead daar de hele zomer had doorgebracht).
De eerste schaakcomputer was De Turk, een uitvinding van de Hongaarse uitvinder Wolfgang von Kempelen in 1770. Hij maakte een machine met een schaakpop waarin iemand verborgen zat die niet alleen heel goed kon schaken, maar ook erg klein was, waarschijnlijk Johann Baptist Allgaier. De Turk ging op tour door Europa en de Verenigde Staten, tot de machine in 1854 door een brand verloren ging. Schrijver Edgar Allan Poe was ook gefascineerd door de Turk. De Amerikaan publiceerde een essay over de Turk, waarin hij dacht het geheim achter de eerste schaakmachine te hebben ontrafeld. De Turk was dus een computer met een mens erin, precies het tegenovergestelde van wat je nu vaak ziet, namelijk schakers die een computer in zichzelf verbergen. Maar dat is weer een geheel andere kwestie.
Na de Turk was het lange tijd stil op het gebied van schaakcomputers, tot de jaren ’70 van de vorige eeuw, toen programmeurs zich op de 64 velden stortten. Rond 1980 kwam de Fidelity Chess Challenger Voice op de markt. Dat was de eerste schaakcomputer voor thuisgebruik, een plastic wit geval met een rating van rond de 1100 die niet kon rokeren of en passent kon slaan. Nog weer een paar decennia later, in 1997, versloeg Deep Blue wereldkampioen Kasparov. Nadat IBM z'n koersen zag stijgen en Kasparov een paar miljoen bij kon schrijven op z’n bankrekening, claimde de Rus heel dramatisch dat hij er alles aan had gedaan het menselijk ras te verdedigden.
Na Kasparov’s bewust of onbewust verloren match, zijn schakende computers alras sterker geworden; Stockfish bereikte onlangs een rating van rond de 3400. Eerlijk gezegd dacht ik dat hier de grens wel zo ongeveer bereikt was. Computers zijn aantoonbaar beter dan mensen, zeker, maar met goed spel kunnen de topgrootmeesters nog wel eens remise houden, dacht ik. Op YouTube staat een filmpje waarin Nakamura met zwart in het Koningsindisch een solide remise speelt tegen Rybka. Konden computers werkelijk nog verbetering laten zien?
Ja, dus. Laten er voor het gemak even vanuit gaan dat Alpha zichzelf binnen korte tijd briljant heeft leren schaken. (En waarom zouden we een bedrijf dat zo veel mogelijk geld probeert te verdienen met de handel in menselijke data - onze meest persoonlijke gedachten en handelingen - en dat probeert te maskeren door allemaal leuke kleurtjes in hun logo, niet geloven?) AlphaZero is zo goed, juist omdat het minder stellingen berekend. De makers zelf noemen dit een 'menselijke benadering'. Als je de tien vrijgegeven partijen (waarom zijn de andere eigenlijk niet vrijgegeven?) bekijkt, moet je inderdaad bekennen dat een en ander tamelijk menselijk aandoet. Alpha offert regelmatig een pion in de opening voor lange termijncompensatie, maar in tegenstelling tot menselijke schakers kloppen die offers altijd.
AlphaZero heeft zichzelf dus in een dagje leren schaken, zegt Google. Een mooie catchphrase, maar is dat ook echt waar? Niet helemaal natuurlijk, want aan de hardware en software is jarenlang gesleuteld. Met andere woorden, en zonder per se filosofisch te willen worden: Als je iemand of iets leert om iets te leren, wanneer begint het leren dan?
Tegen jonge kinderen is algemeen bekend dat je niet moet zeggen dat het heelal oneindig is, want dan kunnen ze in paniek raken. Ik voel me als een kind tegen wie gezegd is dat het heelal ondeindig is én groter wordt. De techniek achter AlphaZero is abracadabra, een oneindige brei van onbegrijpelijke technologie, maar als ik het goed begrijp kan hij dus alles binnen no time leren. Als een computer al binnen een paar uur het meest briljante spel ooit onder de knie krijgt, wat gebeurt er dan als hij zich gaat verdiepen in atoomtechnologie, de hogere kunst van het effectief starten van dictatoriale regimes of het eindeloos produceren en uitvoeren van schlagerliederen? Dan is het leed niet te overzien.
Carlsen’s matige spel in Londen zou het gevolg zijn geweest van ziekte, vermoeidheid of een vormcrisis. Mijn verklaring is de volgende: hij heeft vlak voor het toernooi de partijen van Alpha bekeken. Terwijl Stockfish huilend in zijn bedje lag, voelde ook Carlsen zich kleiner dan ooit, in de wetenschap dat hij nooit zou kunnen tippen aan dit niveau. Carlsen voelt heel goed aan dat hier iets niet pluis is. Hij weet dat AphaZero niet alleen het einde van het menselijke schaken inluidt, maar ook het einde van de wereld zoals wij die kennen.
Benno de Jongh is journalist en schaker, hoewel hij nooit een rating van 2000 heeft bereikt en waarschijnlijk ook nooit zal bereiken. Hij geldt als kenner van het Olifantengambiet en is bezig met een boek over deze onderschatte opening, (werktitel: The Elephant Gambit, A Rare Black Beast with a Proboscis on the Board). Wellicht ten overvloede, maar toch goed om te melden: de meningen van De Jongh zijn in geen geval een reflectie van de mening of het beleid van de toernooiorganisatie. De columns verschijnen op speeldagen rond 3 uur ’s middags op de website.