Matchen slutade: AlphaGo kommer att vara engagerade i att lösa verkliga problem

Förra månaden, mänskligheten förlorat en viktig strid med artificiell intelligens — då AlphaGo slå mästare i e Ki Jae med betyg 3:0. AlphaGo är ett program med artificiell intelligens utvecklad av DeepMind, en del av moderbolaget Google Alfabetet. Förra året, hon besegrade en annan mästare, Om Sedola, 4:1, men sedan dess har betydligt vunnit på poäng.

Ki Jae AlphaGo beskrivs som en “Gud spelet”.

Nu AlphaGo slutar att spela spel, vilket ger spelare möjlighet att, som tidigare, att kämpa sinsemellan. Artificiell intelligens har fått status av en “spelare från den avlägsna framtiden” där människor kommer att växa mycket länge.

På din mark, färdiga, gå

Go är ett gammalt spel för två, där man spelar vit, den andra svart. Uppgift — att fånga dominans på Styrelsen dividerat med 19 horisontella och 19 vertikala linjer. Datorer för att spela go är svårare än schack, eftersom antalet möjliga drag i varje position mycket mer. Detta gör beräkningen av den potentiella drag i förväg — är det möjligt för datorer i schack är mycket svårt.

DeepMind genombrott var utvecklingen av en Allmänt lärande algoritm som, i princip, skulle kunna riktas till mer socialt orienterad riktning. DeepMind säger en grupp forskare AlphaGo försöker att lösa komplexa problem, som exempelvis att hitta nya botemedel mot sjukdomar, en radikal minskning av energiförbrukningen och utvecklingen av nya revolutionerande material.

“Om AI-system som bevisar att du kan få ny kunskap och strategier inom dessa områden, genombrott kommer bara obeskrivlig. Kan inte vänta att se vad som kommer att hända härnäst, säger en av forskarna i projektet.

I framtiden, det står inför många spännande möjligheter, men problemet är fortfarande kvar.

Neurovetenskap och artificiell intelligens

AlphaGo kombinerar två kraftfulla idéer för undervisning, som har utvecklats under de senaste decennierna: djupt lärande och inlärning. Intressant, båda kom från det biologiska begreppet arbete och träning av hjärnan i processen för att få erfarenhet.

I den mänskliga hjärnan sensoriska informationen bearbetas i en serie av lager. Till exempel, den visuella informationen först transformirovalsya i näthinnan, så att de mitthjärnan och sedan passerar genom olika områden av hjärnbarken.

Som ett resultat, det finns en hierarki av predstaveni, där de vid en första finns det enkla och lokala objekt, och sedan svårare och mer komplexa funktioner.

Motsvarande AI kallas deep learning: djupt, eftersom det innehåller många lager av behandling i det enkla neuronopathy datorer enheter.

Men för att överleva i den här världen, djuren behöver inte bara att känna igen sensorisk information, men för att agera i enlighet med det. Generation av forskare och psykologer har studerat hur djur lär sig att vidta åtgärder för att maximera nytta och få en belöning.

Allt detta har lett till matematiska teorier om inlärning, som nu kan genomföras i AI-system. Den viktigaste av dessa är den så kallade TD-lärande, som ökar aktiviteten genom att maximera förväntningarna om framtida utmärkelser.

Bästa drag

Genom en kombination av djupt lärande och inlärning i en serie av artificiella neurala nätverk, AlphaGo först lärde mig att spela på den nivå av en professionell go-spelare på grundval av 30 miljoner drag av spel mellan människor.

Men sedan började han att spela mot mig själv med hjälp av resultatet av varje spel är att obevekligt finslipa sina egna beslut om det bästa draget i varje position på bordet. Det system av värderingar av nätverket lärt mig att förutsäga den sannolika utfall med avseende på varje position, och systemet med försiktighet, nätverket lärt dig att fatta det bästa beslutet i varje situation.

Även om AlphaGo kunde inte prova alla möjliga positioner på Brädet, neurala nätverk har lärt sig de viktigaste idéer om strategier som fungerar bra i alla lägen. Det är dessa oräkneliga timmar av oberoende spel har lett till en förbättrad AlphaGo under det senaste året.

Tyvärr ännu inget känt sätt att hitta ut från ditt nätverk, vilken typ av centrala idéer. Vi kan bara studera spelet och hoppas att få ut något av dem. Detta är ett av problemen med användning av neurala algoritmer: de behöver inte förklara sina beslut.

Vi förstår fortfarande väldigt lite om hur den biologiska hjärnor lära sig, och neurovetenskap fortsätter att ge nya källor till inspiration för AI. Människor kan bli experter i spelet i går, guidade mycket mindre erfarenhet än vad som behövs AlphaGo för att uppnå denna nivå, så finns utrymme för förbättringar av algoritmer är fortfarande det.

Dessutom, de flesta av makt AlphaGo bygger på tekniken med den metod som av misstag tillbaka förökning, som hjälper henne att rätta till misstag. Men kopplingen mellan den och utbildning i en riktig hjärna är fortfarande oklart.

Vad är nästa steg?

Spelet går är en bekväm utveckling-plattformen för optimering av lärande algoritmer. Men många verkliga problem där rörig och har mindre möjligheter till lärande (t ex, självstyrande bilar).

Är det problem som vi kan tillämpa befintliga algoritmer?

Ett exempel kan vara att optimera kontrolleras industriella förhållanden. Här uppgiften är ofta att utföra en komplex serie av uppgifter för att uppfylla flera kriterier och för att minimera kostnaderna.

Tills dess, tills de villkor kan vara korrekt modellerade, dessa algoritmer kommer att lära dig och få erfarenhet snabbare och mer effektivt än människor. Du kan bara upprepa de ord som företaget DeepMind: jag skulle vilja se vad som kommer att hända härnäst.

Matchen slutade: AlphaGo kommer att vara engagerade i att lösa verkliga problem
Ilya Hel


Date:

by