Google ‘ s artificial intelligence søskende DeepMind repurposes Gå-spiller AI til at erobre skak og shogi uden støtte af menneskelig viden
DeepMind
AlphaZero AI beats champion skak-program efter at lære sig selv i fire timer
Google ‘ s artificial intelligence søskende DeepMind repurposes Gå-spiller AI til at erobre skak og shogi uden støtte af menneskelig viden
Torsdag den 7 December 2017 12.41 GMT
AlphaZero, spillet-at spille AI skabt af Google søskende DeepMind, har slået verdens bedste skak-spiller computer-program, der har lært sig selv at spille på under fire timer.
Den repurposed AI, som har flere gange slået verdens bedste Go spillere, som AlphaGo, er blevet generaliseret, så det kan nu lære andre spil. Det tog kun fire timer til at lære reglerne for skak, før du slå verdensmester i skak program, Tørfisk 8, i en 100-spil match op.
AlphaZero vundet eller trak alle 100 spil, efter en ikke-peer-reviewed videnskabelig artikel, der er offentliggjort sammen med Cornell University Library ‘ s arXiv.
“Fra tilfældige spil, og i betragtning af, at domænet ikke er viden, undtagen de spil regler, AlphaZero nås inden for 24 timer en overmenneskelig niveau i skak og shogi [et lignende Japansk brætspil], samt Gå og overbevisende besejrede en verdensmester program i hvert enkelt tilfælde,” siger papirets forfattere, der omfatter DeepMind grundlægger Demis Hassabis, der var et barn skak prodigy nå master standard i en alder af 13.
“Det er et bemærkelsesværdigt resultat, selv hvis vi skulle have forventet det efter AlphaGo,” tidligere verdensmester i skak Garry Kasparov fortalte Chess.com. “Vi har altid antaget, at skak, der kræves for meget empirisk viden for en maskine til at spille så godt fra bunden, med ingen menneskelig viden tilføjet på alle.”
Edb-programmer, har været i stand til at slå de bedste menneskelige skak spillere nogensinde, da IBM ‘ s Deep Blue supercomputer besejret Kasparov på 12 Maj 1997.
DeepMind sagde, at forskellen mellem AlphaZero og sine konkurrenter er, at dens maskine-tilgang til læring er ikke menneskelige input, bortset fra de grundlæggende regler for skak. Resten, det virker ved at spille sig selv igen og igen med selv-styrket viden. Resultatet, ifølge DeepMind, er, at AlphaZero tog en “nok mere menneskelig tilgang” til at søge bevæger sig, behandling omkring 80.000 positioner per sekund i skak i forhold til at Tørfisk 8 s 70m.
Efter at have vundet 25 skak versus Tørfisk 8 starter som hvid, med first-mover fordel, yderligere tre starter med sort og tegne en yderligere 72 spil, AlphaZero også lært, shogi i to timer, før du slå den førende program Elmo i en 100-spil match up. AlphaZero vandt 90 kampe, tabte otte og trak 2.
Den nye generelle AlphaZero var også i stand til at slå det “overmenneskelige” tidligere version af sig selv AlphaGo på det Kinesiske spil Go, efter kun otte-timers self-uddannelse, 60 spil for at vinde og tabe 40 spil.
Mens eksperter siger, at resultaterne er imponerende, og har potentiale på tværs af en bred vifte af programmer til at supplere den menneskelige viden, professor Joanna Bryson, en datalog og AI-forsker ved University of Bath, advarede om, at det var “stadig er en diskret opgave”.
- “Det er i stand til at skabe viden i sig selv’: Google lancerer AI, der lærer på sin egen