Das Spiel ausging: AlphaGo sich um die Lösung von realen Problemen

Im letzten Monat hat die Menschheit verloren eine große Schlacht mit künstlicher Intelligenz — dann AlphaGo Champion gewann durch th Jae Ki mit der Rechnung 3:0. AlphaGo ist ein Programm mit künstlicher Intelligenz, DeepMind entwickelt, ein Teil der Muttergesellschaft Google-Alphabet. Im vergangenen Jahr wurde Sie gegen einen anderen Champion, Ob Седоля, mit der Rechnung 4:1, aber seitdem deutlich gewann nach Punkten.

Ki Jae beschrieb AlphaGo wie «Gott go-Spiel».

Jetzt AlphaGo beendet spielen, bietet die Möglichkeit, die Spieler nach wie vor zu kämpfen. Künstliche Intelligenz hat Sie den Status «Spieler aus der Fernen Zukunft», auf das Niveau der Menschen müssen wachsen sehr lange.

Auf die Plätze, fertig, go

Go ist ein altes Spiel für zwei, wo man spielt den weißen Figuren, der andere schwarz. Aufgabe — erfassen доминацию an die Tafel, eingeteilt in 19 horizontalen und 19 vertikalen Linien. Computer spielen in th schwieriger als Schach, weil die Anzahl der möglichen Züge in jeder Position viel mehr. Das macht Fehleinschätzung der möglichen Züge im Voraus — es ist durchaus möglich für Computer im Schach — sehr anspruchsvoll in th.

Durchbruch DeepMind war die Entwicklung eines gemeinsamen Algorithmus der Ausbildung, die im Prinzip richten Sie bitte in einer mehr sozial orientierten Richtung, als th. DeepMind sagt, dass eine Gruppe von Forschern AlphaGo versucht zu lösen komplexe Probleme wie die Suche nach neuen Behandlungen für Krankheiten, die Radikale Senkung des Energieverbrauchs oder die Entwicklung der neuen revolutionären Materialien.

«Wenn ein KI-System beweist, dass in der Lage, erwerben neues wissen und Strategien in diesen Bereichen, Durchbrüche werden einfach unbeschreiblich. Ich kann nicht warten, um zu sehen, was als Nächstes passieren wird», sagt einer der Wissenschaftler des Projekts.

In der Zukunft droht vielen spannenden Möglichkeiten, aber die Probleme noch nicht verschwunden.

Neurobiologie und künstliche Intelligenz

AlphaGo vereint zwei starke Ideen rund um das Thema Ausbildung, haben die Entwicklung in den letzten Jahrzehnten: fundierte Ausbildung und das Training mit Verstärkung. Bemerkenswert ist, dass beide Richtungen gingen aus dem biologischen Konzept der Arbeit und der Ausbildung des Gehirns im Prozess der Erfahrung.

Im menschlichen Gehirn sensorische Information wird in einer Reihe von Schichten. Zum Beispiel die visuelle Information zunächst in der Netzhaut umgewandelt, dann im mittleren Gehirn, und führt dann durch die verschiedenen Bereiche der Großhirnrinde.

Am Ende erscheint eine Hierarchie представений, wo zuerst kommt die einfache und lokalisierte Details, und dann komplexere Eigenschaften.

Das äquivalent in der KI nennt man tiefen der Ausbildung: die Tiefe, denn es enthält eine Vielzahl von Schichten Verarbeitung in einfachen нейроноподобных Computing-Einheiten.

Aber um zu überleben in dieser Welt, die Tiere müssen nicht nur das erkennen von sensorischen Informationen, sondern auch entsprechend zu handeln. Generation von Wissenschaftlern und Psychologen haben untersucht, wie Tiere lernen, Maßnahmen zu ergreifen, um zu maximieren erwärmen, das dadurch profitieren und bekommen eine Belohnung.

All dies führte zu den mathematischen Theorien des Lernens mit einer Verstärkung, die jetzt können Sie implementieren im KI-System. Die wichtigste von Ihnen ist die so genannte TD-Ausbildung, die verbessert die Aktion durch die Maximierung der Erwartung der zukünftigen Prämien.

Die besten Züge

Durch eine Kombination von Deep-learning und des Lernens mit einer Verstärkung in einer Reihe von künstlichen neuronalen Netzen, AlphaGo zuerst lernte, wie man auf der Ebene der professionellen Spieler in th auf der Grundlage von 30 Millionen Hübe der Spiele zwischen Menschen.

Aber dann begann er zu spielen gegen sich selbst, indem das Ergebnis eines jeden Spiels, um unaufhaltsam zu schärfen, eigene Entscheidungen über den besten Rahmen in jeder Position auf dem Brett. Wertesystem Netz gelernt, das wahrscheinliche Ergebnis Vorhersagen, unter Berücksichtigung jeder Position, und das System der Vernunft Netz gelernt hat, nehmen Sie die beste Lösung in jeder Situation.

Obwohl AlphaGo konnte nicht ausprobieren aller möglichen Positionen auf dem Brett, neuronale Netze löschten die wichtigsten Ideen über Strategien, die gut funktionieren in jeder Position. Genau diese selbst unzählige Stunden des Spiels führte zur Verbesserung der AlphaGo im letzten Jahr.

Leider gibt es bisher noch keine bekannten Möglichkeiten, um herauszufinden Netzwerk, was ist das für eine wichtige Idee. Wir können einfach lernen, das Spiel und hoffen, dass etwas rausholen. Das ist eines der Probleme der Verwendung von neuronalen algorithmen: Sie erklären nicht Ihre Entscheidung.

Wir immer noch wenig wissen darüber, wie studieren biologischen Gehirn, Neurobiologie und weiterhin neue Quellen der Inspiration für die KI. Menschen können sich von den Experten im Spiel., geleitet von viel weniger Erfahrung, als notwendig AlphaGo solches Niveau zu erreichen, so dass Raum für die Verbesserung der algorithmen ist noch.

Darüber hinaus wird ein großer Teil der Leistung AlphaGo basiert auf der Technik der Methode Reverse Verteilung Fehler, die Ihr hilft, Fehler zu korrigieren. Aber die Verbindung zwischen Ihr und der Ausbildung in einem echten Gehirn ist noch unklar.

Was kommt als Nächstes?

Ein Spiel hat sich eine komfortable Entwicklungsplattform für die Optimierung dieser algorithmen. Aber viele Probleme der realen Welt wo беспорядочнее und haben weniger Möglichkeiten für das Selbststudium (Z. B. selbst Autos).

Gibt es Probleme, die wir anwenden können vorhandene algorithmen?

Ein Beispiel kann die Optimierung der kontrollierten industriellen Bedingungen. Hier die Aufgabe besteht oft darin, dass Sie eine komplexe Reihe von Aufgaben, die Sie erfüllen eine Vielzahl von Kriterien und Kosten zu minimieren.

Solange die Bedingungen werden genau modelliert werden, diese algorithmen werden lernen und Erfahrungen zu sammeln schneller und effizienter als Menschen. Man kann nur die Worte wiederholen des Unternehmens DeepMind: Sie will sehen, was als Nächstes passieren wird.

Das Spiel ausging: AlphaGo sich um die Lösung von realen Problemen
Ilja Hel