Googles kunstig intelligens søsken DeepMind repurposes Gå-spiller AI å erobre sjakk og shogi uten hjelp av menneskelig kunnskap
DeepMind
AlphaZero AI beats mester i sjakk-program etter at undervisningen i seg selv i fire timer
Googles kunstig intelligens søsken DeepMind repurposes Gå-spiller AI å erobre sjakk og shogi uten hjelp av menneskelig kunnskap
Torsdag 7. desember 2017 12.41 GMT
AlphaZero, spill-spille AI opprettet av Google søsken DeepMind, har kåret verdens beste sjakk-spiller dataprogram, å ha lært seg hvordan å spille på under fire timer.
Den ombygginger AI, som er flere ganger kåret til verdens beste Go-spillere som AlphaGo, har blitt generalisert, slik at det kan nå lære andre spill. Det tok bare fire timer til å lære deg reglene for sjakk før du slo verdensmesteren i sjakk program, Tørrfisk 8, i et 100-spill match opp.
AlphaZero vunnet eller trakk alle 100 spill, i henhold til en ikke-peer-reviewed forskning papir publisert med Cornell University Library er arXiv.
“Fra random play, og du får ingen domene kunnskap med unntak av spillets regler, AlphaZero oppnådd innen 24 timer for en overmenneskelig nivå av spill i spill av sjakk og shogi [en lignende Japanske brettspillet] så vel som å Gå, og på en overbevisende måte beseiret en verdens-mester program i hvert enkelt tilfelle,” sa papiret er forfattere som inkluderer DeepMind grunnlegger Demis Hassabis, som var et barn sjakk-vidunderbarn nå master standard i en alder av 13.
“Det er en bemerkelsesverdig prestasjon, selv om vi burde ha forventet det etter AlphaGo,” tidligere verdens sjakk Garry Kasparov fortalt Chess.com. “Vi har alltid antatt at sjakk som kreves for mye empirisk kunnskap for en maskin til å spille så godt fra bunnen av, uten menneskelig kunnskap til alle.”
Dataprogrammer har vært i stand til å slå de beste menneskelige sjakkspillere helt siden IBM ‘ s Dyp Blå superdatamaskin slo Kasparov 12. Mai 1997.
DeepMind sa forskjellen mellom AlphaZero og konkurrentene er at den maskin-læring tilnærming er gitt noe menneskelig input bortsett fra de grunnleggende reglene i sjakk. Resten virker det ut ved å spille seg selv om og om igjen med selv-forsterket kunnskap. Resultatet, i henhold til DeepMind, er at AlphaZero tok en “kanskje mer menneskelig-lignende tilnærming” til å lete etter trekk, behandling rundt 80 000 stillinger per sekund i sjakk i forhold til Tørrfisk 8 70m.
Etter å ha vunnet 25 spill sjakk mot Tørrfisk 8 starter som en hvit, med første-mover fordel med en ytterligere tre starter med svart og tegne en ytterligere 72 spill, AlphaZero også lært shogi i to timer før du slo den ledende program Elmo i et 100-spill matchup. AlphaZero vant 90 spill, mistet åtte og trakk 2.
Den nye generell AlphaZero var også i stand til å slå “super menneskelige” tidligere versjon av seg selv AlphaGo på den Kinesiske spillet Gå etter bare åtte timer av selv-trening, og vant 60 spill og å miste 40 spill.
Mens eksperter sa resultatene er imponerende, og har potensial på tvers av et bredt spekter av programmer for å komplettere menneskelig kunnskap, professor Johanna Bryson, en forsker og AI forsker ved University of Bath, advart om at det var “fortsatt en diskret oppgave”.
- “Det er i stand til å skape kunnskap i seg selv’: Google lanserer AI som lærer på sin egen