En Google DeepMind Algoritmen Använder Djupt Lärande och Mer att Behärska Spelet Går

Google får en av de långvariga “grand challenges” av AI genom att bygga en dator som kan slå expert spelare på brädspelet Go.

Google har tagit en lysande och oväntade steg mot att bygga en AI med mer mänsklig intuition, att utveckla en dator som kan slå även expert mänskliga spelare på den oerhört komplicerade brädspelet Go.

Målet att Gå, ett spel som uppfanns i Kina för mer än 2 500 år sedan, är ganska enkel: spelare måste omväxlande placerar svart och vitt “stenar” på ett rutnät av 19 horisontella och 19 vertikala linjer med syftet med omgivande motståndarens pjäser, och undvika att ha en egen bitar omgiven. Mastering Går, men kräver oändliga praktiken, liksom ett finstämt knep för att känna igen subtila mönster i placeringen av de bitar som sprids över hela linjen.

Googles team har visat att de färdigheter som behövs för att behärska Gå är inte så unikt mänsklig trots allt. Deras dator program, som kallas Alfa Gå, slå Europeisk mästare, Fläkt Hui, fem spel till noll. Och i Mars kommer det att ta på en av världens bästa spelare, Lee Sedol, i en turnering som kommer att hållas i Seoul, Sydkorea.

“Go är den mest komplexa och vackra spelet som någonsin skapats av människan,” Demis Hassabis, chef för Google-teamet, och sig själv en ivrig spelare Gå, sade vid en presskonferens. Genom att slå Fläkt Hui, tillade han, “vårt program för att uppnå en långvarig med stora utmaningar i AI.”

Hassabis sade också att de tekniker som används för att skapa Alpha Gå skulle låna ut sig till sitt lags insats för att utveckla en generell AI. “Slutligen vill vi att tillämpa dessa tekniker för att viktiga verkliga problem”, sade han. “Eftersom de metoder vi använde var allmänt ändamål, vår förhoppning är att de en dag skulle kunna utvidgas till att bidra till att lösa några av samhällets mest angelägna problem, från medicinsk diagnostik till climate modeling” (se “Kunde AI Lösa Världens Största Problem?”).

Hassabis sa det första hur tekniken kan tillämpas på Google skulle innebära utveckling av bättre programvara för personliga assistenter. En sådan assistent, skulle lära sig användarens preferenser från hans beteende på internet, och göra mer intuitiva rekommendationer om produkter eller evenemang, föreslog han.

Resan är långt mer utmanande för datorer än, säg, schack, av två orsaker: antal potentiella drag i varje sväng är långt högre, och det finns inget enkelt sätt att mäta materialets fördel. En spelare måste därför lära sig att känna igen abstrakta mönster i hundratals bitar placerade över hela linjen. Och även experter kämpar ofta för att förklara varför en viss position verkar fördelaktigt eller problematiskt.

Bara ett par år sedan, i själva verket, de flesta Go-spelare och spel programmerare trodde spelet var så komplext att det skulle ta flera decennier innan datorer kan nå den standard av en mänsklig expert spelare.

Alpha Gå utvecklades av ett team som kallas Google DeepMind, en grupp som skapats efter att Google köpte en liten AI STORBRITANNIEN startup som heter DeepMind 2014. Forskarna byggt Alpha Gå med hjälp av en extremt populär och framgångsrik maskin-lärande metod som kallas deep learning kombineras med en annan simulering teknik för modellering potentiella drag. Djupt lärande innebär att utbildning en stor simulerade neurala nätverk för att svara på mönster i data. Det har visat sig vara mycket användbart för bild och ljud bearbetning, och många stora företag är att utforska nya sätt att tillämpa tekniken.

Två djupa-lärande nätverk användes i Alpha Gå: ett nätverk lärt sig att förutse nästa drag, och de andra lärt sig att förutsäga resultatet från olika arrangemang på bordet. De två nätverk, i kombination med en mer konventionell AI algoritm för att se framåt i spelet för möjliga drag. En vetenskaplig uppsats skriven av forskare från Google som beskriver det arbete som visas i tidskriften Nature idag.

“Spelet Go har en enorm sök utrymme, som är svårbehandlad att brute-force search”, säger David Silver, ett annat Google-forskaren som ledde insatsen. “Nyckeln till Alpha Gå är att minska att söka utrymme till något mer hanterbart. Detta tillvägagångssätt gör att Alpha Gå mycket mer mänsklig än tidigare metoder.”

När IBMS dator Deep Blue behärskar schack 1997, det används för hand-kodade regler och uttömmande sökte igenom potentiella schack drag. Alpha Går i huvudsak lärt mig med tiden att känna igen potentiellt fördelaktiga mönster, och sedan simulerade ett begränsat antal potentiella resultat.

Google ‘ s utveckling har mött ett stort grattis och några förvåning av andra forskare inom området.

“På den tekniska sidan, detta arbete är ett monumentalt bidrag till AI, säger Ilja Sutskever, en ledande AI-forskare och chef för en ny ideell kallas OpenAI (se “Innovatörer Under 35: Ilya Sutskever”). Sutskever säger det arbete som var speciellt viktigt eftersom Alpha Går i huvudsak lärt sig hur man vinner. “Samma teknik kan användas för att uppnå extremt hög prestanda på många andra spel också, säger han.

Michael Bowling, professor i datavetenskap vid University of Alberta i Kanada, som nyligen utvecklat ett program som kan slå vem som helst när heads-up-limit-poker, var också upphetsad av prestation. Han tror att metoden bör verkligen vara användbar i många områden där machine learning tillämpas. “En hel del av det som vi traditionellt ser som den mänskliga intelligensen är byggt runt mönstermatchning”, säger han. “Och en hel del av vad vi skulle tänka på som att lära sig är att ha sett dessa mönster i det förflutna, och att kunna inse hur de ansluter till en aktuell situation.”

En aspekt av ett resultat värt att notera är att den kombinerar djup lärande med andra tekniker, säger Gary Marcus, professor i psykologi vid New York University och en av grundarna och VD för Geometriska Intelligens, AI start som också kombinera djup lärande med andra metoder (se “hur Kan den Här Mannen Gör AI Mer Mänskliga?”).

“Detta är inte ett så kallat end-to-end djupt lärande system,” säger Marcus. “Det är en noggrant strukturerad, modulärt system med några tankeväckande hand-teknik på den fronten. Vilket, när man tänker på det, ganska parallell till det mänskliga sinnet: rika, modulär, med lite tweaking av utvecklingen, snarare än bara en massa nervceller slumpmässigt sammankopplade och anpassas helt och hållet av erfarenhet.”

Se AI master Gå kan också leda till att vissa existentiell ångest. Under presskonferensen meddelade nyheten, Hassabis inför frågor om långsiktiga risker av AI-system som Google håller på att utveckla. Han sade att företaget vidtar åtgärder för att minska dessa risker genom att samarbeta med forskare, genom att organisera konferenser, och genom att arbeta med en inre etik som styrelsen.


Date:

by