Supercomputer leert zichzelf Go spelen en is direct beste ter wereld

Een supercomputer heeft zichzelf het razend ingewikkelde spel Go geleerd om vervolgens met gemak ‘s werelds beste speler te verslaan.

AlphaGo Zero van DeepMind, Googles afdeling voor kunstmatige intelligentie, is uniek vanwege zijn zelflerende vermogen. Voorganger AlphaGo kreeg input van duizenden spelletjes tussen de beste menselijke spelers en leerde door de winnende zetten te bestuderen. AlphaGo Zero wist echter alleen de spelregels en het doel van het spel. De computer leerde heel snel door duizenden keren tegen zichzelf te spelen.

Niet alleen is het bijzonder dat de computer alle expertise ontwikkelde door enkel gebruik te maken van kunstmatige intelligentie, ook zijn leercurve is indrukwekkend. In drie uur tijd is AlphaGo Zero net zo goed als een beginner. Na negentien uur verslaat hij ook gevorderde spelers en na zeventig uur bereikt de computer een niveau dat ver boven de mens uitstijgt.

“AlphaGo Zero versloeg zijn voorganger Alpha Go honderd keer op een rij”, vertelt Demis Hassabis, de baas van DeepMind. Hij presenteerde de resultaten samen met Lee Se-Dol, de beste Go-speler ter wereld, die op pijnlijke wijze werd ingemaakt door de supercomputer.

Bron(nen):   Newsmonkey