Datamaskinen som lamslått menneskeheten ved å slå de beste dødelige spillere på en strategi brettspill krever “intuisjon” har blitt enda smartere, sine beslutningstakere sa onsdag.
Enda mer oppsiktsvekkende, er den oppdaterte versjonen av AlphaGo er helt selvlært — et stort steg mot fremveksten av maskiner som oppnår overmenneskelige evner “, uten noen menneskelig input”, rapporterte de i den vitenskapelige tidsskriftet Nature.
Kalt AlphaGo Null, Kunstig Intelligens (AI) system lært av seg selv i løpet av dager, for å mestre den gamle Kinesiske brettspill kjent som Go – som sies å være det mest komplekse to-person utfordring noensinne oppfunnet.
Det kom opp med sin egen, roman beveger seg å overskygge alle de Gå skarpsindighet mennesker har tilegnet seg gjennom tusenvis av år.
Etter bare tre dager av selv-trening det ble lagt til den ultimate testen mot AlphaGo, med sin forløper som tidligere avsatte toppen menneskelige champs.
AlphaGo Null vunnet av 100 spill til null.
“AlphaGo Null ikke bare gjenoppdaget felles mønstre og åpninger for at mennesker har en tendens til å spille… det til slutt forkastet dem i preferanse for sin egen varianter som mennesker ikke engang vet om eller spille i øyeblikket,” sa AlphaGo føre forsker David Sølv.
3000 år gamle Kinesiske spillet spilles med svarte og hvite steiner på et bord, har mer flytte konfigurasjoner mulig enn det er atomer i Universet.
AlphaGo gjort verden overskrifter med sin sjokk 4-1 seier i Mars 2016 over 18-tiden Går mester Lee Se-Dol, en av spillet all-time mestere.
Lee ‘ s nederlag viste at AI ble det går mye raskere enn antatt, sa eksperter på den tiden som kalles for regler for å sikre at kraftig AI alltid forblir helt under menneskelig kontroll.
I Mai dette året, en oppdatert AlphaGo Master-programmet beat verdens Nummer Én Ke Jie i tre kamper av tre.
Ikke begrenset av mennesker
I motsetning til sine forgjengere som trente på data fra tusenvis av menneskelige spill før praktisere ved å spille mot seg selv, AlphaGo Null gjorde ikke lære fra mennesker, eller ved å spille mot dem, ifølge forskere ved DeepMind, den Britiske kunstig intelligens (AI) selskapet å utvikle systemet.
“Alle tidligere versjoner av AlphaGo… det ble sagt:” Vel, i denne stillingen menneskelig ekspert spilt denne spesielle flytte, og i denne andre plasser menneskelig ekspert spilt her’,” Sølv sa han i en video som forklarer forhånd.
AlphaGo Null hoppet over dette trinnet.
I stedet ble det programmert til å reagere på belønning-en positiv poeng for en seier, mot et negativt punkt for tap.
Du starter med bare reglene i Går og ingen instruksjoner, systemet har lært spillet, utviklet strategi og forbedret som konkurrerte mot seg selv, og starter med “helt random play” for å finne ut hvordan lønnen er opptjent.
Dette er en prøve-og-feile-prosess kjent som “forsterkning læring”.
I motsetning til sine forgjengere, AlphaGo Null “er ikke lenger begrenset av grensene for menneskelig kunnskap”, Sølv og DeepMind administrerende DIREKTØR Demis Hassabis skrev i en blogg.
Utrolig, AlphaGo Null brukt en enkelt maskin – en menneskelig hjerne-å etterligne “nevrale nettverk” – i forhold til flere-maskin “hjernen” som slo Lee.
Det hadde fire databehandling enheter i forhold til AlphaGo s 48, og spilte 4,9 millioner trening spill over tre dager, mot 30 millioner kroner over flere måneder.
Begynnelsen av slutten?
“Folk har en tendens til å anta at maskinlæring er alle om big data og massive mengder beregning men faktisk hva vi så med AlphaGo Null er at algoritmer saken mye mer,” sa Sølv.
Resultatene antydet at AI basert på reinforcement learning gjort det bedre enn de som er avhengige av menneskelig kompetanse, Satinder Singh ved University of Michigan, skrev i en kommentar også gjennomført av Natur.
“Men, dette er ikke begynnelsen på en hvilken som helst grunn AlphaGo Null, som alle andre vellykkede AI så langt, er svært begrenset i hva du vet det, og i hva den kan gjøre sammenlignet med mennesker og andre dyr,” sa han.
AlphaGo Null evne til å lære på sin egen “kan vises creepily autonome”, lagt Anders Sandberg av Future of Humanity Institute ved Universitetet i Oxford.
Men det var en viktig forskjell, sa han til AFP, “mellom generell smarte mennesker har, og de spesialiserte smarts” programvare.
“Hva DeepMind har vist gjennom de siste årene er at man kan gjøre programvare som kan bli omgjort til eksperter i ulike domener… men det blir ikke generelt intelligent.”
Det var også verdt å merke seg at AlphaGo var ikke programmering seg selv, sa Sandberg.
“Den smarte innsikt gjør Null bedre var på grunn av mennesker, er ikke all programvare som tyder på at denne tilnærmingen ville være bra. Jeg ville begynne å bli bekymret når det skjer.”