AlphaZero selbst lernt spielen auf höchstem Niveau

Eine Gruppe von Wissenschaftlern aus der Gruppe von DeepMind und dem University College in London entwickelt ein System der künstlichen Intelligenz, das Spiel selbst lernen und Verbesserung in drei komplexen Brettspielen. In seiner Arbeit, veröffentlicht in der Zeitschrift Science, Wissenschaftler beschreiben Ihr neues System und erklären, warum Sie glauben, dass es ist ein großer Schritt in Richtung der Entwicklung zukünftiger Systeme der KI.

Es dauerte mehr als 20 Jahre her, als der Supercomputer Deep Blue besiegt den Schachweltmeister Gary Kasparov und hat der Welt gezeigt, wie weit Fortgeschritten die Berechnungen im Bereich der KI. Seitdem die Computer wurden immer schlauer und heute gewinnen die Menschen in spielen wie Schach, Shogi und go. Doch jedes dieser Programme Einstellung speziell, um ein Meister in einem separaten Spiel. In seinem neuen Job die Wissenschaftler haben die Schaffung der künstlichen Intelligenz, die nicht nur gut in ein paar Spiele, sondern auch ausgebildet ist, diese Verbesserung selbst.

AlphaZero: der neue Assistent

Das neue System namens AlphaZero ist ein System des Lernens mit einer Verstärkung, D. H. lernt, wiederholt das Spiel und lernen Sie von seiner Erfahrung. Es ist natürlich sehr ähnlich dem Prozess des Lernens von Menschen. Wird den stützpunktsatz der Regeln und der Computer spielt ein Spiel — mit mir selbst. Ihm sogar Partner sind nicht notwendig. Er spielt mit sich selbst viele Male, feststellend, dass die gute und erfolgreiche Spielzüge. Mit der Zeit wird er immer besser wird, übertrifft nicht nur Menschen, sondern auch andere KI-System, entwickelt für Gesellschaftsspiele. Dieses System verwendete auch die Methode der Suche «Suche nach dem Baum des Monte-Carlo». Kombination von zwei Technologien erlaubt das System lernen, die Verbesserung im Spiel. Die Wissenschaftler probierten die Kräfte des Programms, indem Sie Ihre große Kapazität — 5000 тензорных Prozessoren, gepaart mit einem großen Supercomputer.

Im Moment AlphaZero beherrscht Schach, Shogi und go. Der nächste Schritt wird die beliebte Videospiel. Im Hinblick auf die Leistung des KI, dann in th, z.B. AlphaZero gewann den legendären AlphaGo schon nach 30 Stunden.

Was denken Sie, wenn die Explosion der künstlichen Intelligenz? Erzählen Sie uns in unserem Chat in Телеграме.