Bild: AP
Ausgefallene algorithmen in der Lage die Lösung eines Rubik ‘ s Cube erschienen, bevor, aber ein neues system von der University of California, Irvine nutzt künstliche Intelligenz zu lösen, die 3D-puzzle von Grund auf und ohne jede Vorherige Hilfe von Menschen—und er tut dies mit beeindruckender Geschwindigkeit und Effizienz.
Neue Forschung, veröffentlicht in dieser Woche in der Natur die Intelligenz an der Maschine beschreibt DeepCubeA, ein system in der Lage die Lösung alle Durcheinander Rubik ‘ s Cube ist es mit vorgestellt. Mehr eindrucksvoll, Sie finden den effizientesten Weg zum Erfolg—das ist die Lösung, dass der geringsten Anzahl von Zügen—rund 60 Prozent der Zeit. Im Durchschnitt DeepCubeA benötigt nur 28 bewegt, um das puzzle zu lösen, erfordern 1,2 Sekunden zur Berechnung der Lösung.
Sehen Sie Diese Maschine Lösen einen Rubik ‘ s Cube Schneller Als Mein Kiefer Fallen Können
Vor etwa einem Jahr letzten März, einen Roboter namens Sub1 lösen einen Rubik ‘ s Cube in 0.637 Sekunden,…
Lesen Sie mehr Lesen
Klingt schnell, aber andere Systeme gelöst werden, die 3D-puzzle in weniger Zeit, darunter ein Roboter, lösen den Rubik ‘ s cube in nur 0,38 Sekunden. Aber diese Systeme wurden speziell für die Aufgabe, die Verwendung von human-Drehbuch-algorithmen, um das Rätsel zu lösen, in die effizienteste Art und Weise möglich. DeepCubeA, auf der anderen Seite, unterrichtete selbst zu lösen Rubik ‘ s Cube mit einem Ansatz der künstlichen Intelligenz, bekannt als reinforcement learning.
“Künstliche Intelligenz kann die Niederlage der weltweit besten menschlichen Schach-und Go-Spieler, aber einige der schwierigeren Rätsel wie der Rubik ‘s Cube, wurde nicht mit Computern lösen, so dass wir dachten, Sie waren offen für die KI-Ansätze”, sagte Pierre Baldi, der senior-Autor der neuen Papier, in einer Pressemitteilung. “Die Lösung für den Rubik’ s Cube geht es um mehr symbolischen, mathematischen und abstrakten denken, so ein tiefes lernen-Maschine, die knacken können wie ein puzzle immer näher rückt, ist immer ein system, das denken, die Vernunft, zu planen und Entscheidungen zu treffen.”
In der Tat, ein Expertensystem entwickelt, für eine Aufgabe und eine Aufgabe—wie die Lösung eines Rubik ‘ s Cube—immer beschränkt auf die Domäne, aber ein system wie DeepCubeA, mit der äußerst anpassungsfähige neuronale Netz, könnte genutzt werden, für andere Aufgaben, wie die Lösung komplexer wissenschaftlicher, mathematischer und technischer Probleme. Was mehr ist, dieses system “ist ein kleiner Schritt in Richtung der Schaffung Agenten, die in der Lage sind, zu lernen, zu denken und zu planen für sich in der neuen Umgebung,” Stephen McAleer, ein co-Autor der neuen Papier, sagte Gizmodo.
Reinforcement learning funktioniert, wie es klingt. Systeme motiviert sind, zu erreichen ein Ziel bezeichnet, während welcher Zeit Sie Punkte erhalten, für die Bereitstellung von erfolgreichen Aktionen oder Strategien, und Sie verlieren Punkte für das Abgehen vom Kurs ab. Dies ermöglicht die algorithmen, die im Laufe der Zeit verbessern, und ohne menschlichen Eingriff.
Reinforcement learning sinnvoll für einen Rubik ‘ s Cube, wegen der garstigen Zahl der möglichen Kombinationen auf die 3x3x3 Rätsel, die eine Höhe von rund 43 quintillion. Einfach wählen zufällige Bewegungen mit der Hoffnung, die Lösung der cube ist einfach nicht zur Arbeit gehen, weder für den Menschen noch zu den weltweit leistungsstärksten Supercomputer.
DeepCubeA ist nicht der erste kick bei der können für diese der Universität von Kalifornien, Irvine Forscher. Ihre frühere system, genannt DeepCube, verwendet einen herkömmlichen Baum-such-Strategie und ein reinforcement learning System, ähnlich der eines Beschäftigten von DeepMind ist AlphaZero. Aber auch wenn dieser Ansatz funktioniert gut für one-on-one-Brettspielen wie Schach und Go, erwies es sich als ungeschickt für Rubik ‘ s Cube. In tests, die DeepCube system benötigt zu viel Zeit, um seine Berechnungen und seine Lösungen waren oft zu weit Weg vom ideal.
Das UCI-team verwendet einen anderen Ansatz mit DeepCubeA. Beginnend mit einem gelösten Würfel, das system aus zufällige Bewegungen mischen des Puzzles. Im Grunde, es gelernt zu beherrschen, bei der Rubik ‘ s Cube, indem Sie es in umgekehrter Richtung. Auf den ersten, die bewegt wurden, waren wenige, aber der wirre Zustand wurde mehr und mehr kompliziert, wie die Ausbildung Fortgeschritten ist. In allen, DeepCubeA gespielt 10 Milliarden verschiedene Kombinationen in zwei Tagen funktionierte es, den Würfel zu lösen, die in weniger als 30 Züge.
“DeepCubeA versucht, den Würfel zu lösen mit der geringsten Anzahl von Zügen”, erklärte McAleer. “Damit die Bewegungen dazu neigen, schauen viel anders aus, wie ein Mensch lösen den Würfel.”
Nach dem training wurde das system mit der Aufgabe, der Lösung von 1.000 nach dem Zufallsprinzip verschlüsselt, die Rubik ‘ s Cubes. In tests, DeepCubeA eine Lösung gefunden, um 100 Prozent aller cubes, und er fand einen kürzesten Weg zum Ziel-Zustand 60.3 Prozent der Zeit. Das system benötigt 28 bewegt sich im Durchschnitt, den Würfel zu lösen, die Sie haben in etwa 1,2 Sekunden. Durch Vergleich, der Schnellste Mensch puzzle Solver erfordern um die 50 bewegt.
“Da haben wir festgestellt, dass DeepCubeA ist die Lösung der cube in den wenigsten bewegt sich 60 Prozent der Zeit, es ist ziemlich klar, dass die Strategie ist es mit ist der Nähe der optimalen Strategie, umgangssprachlich bezeichnet als Gottes Algorithmus,” Studie co-Autor Wald Agostinelli sagte Gizmodo. “Während die menschliche Strategien sind leicht erklärbar mit Schritt-für-Schritt-Anweisungen, die Festlegung einer optimalen Strategie, die oft erfordert anspruchsvolle Kenntnisse der Gruppen-Theorie und Kombinatorik. Obwohl mathematisch die Definition dieser Strategie nicht in den Anwendungsbereich dieses Papiers, können wir sehen, dass die Strategie DeepCubeA beschäftigt, ist eine, die nicht sofort offensichtlich zu den Menschen.”
Zur Demonstration der Flexibilität des Systems, DeepCubeA wurde auch gelehrt, zu lösen anderer Rätsel, einschließlich Schiebe-Fliese Rätsel, Spiele, Lights Out und Sokoban, die es getan haben mit ähnlichen Fähigkeiten.
“Wir wendeten unser Algorithmus insgesamt sieben Rätsel und festgestellt, dass es in der Lage, Sie alle lösen. Daher, dies ist ein Beweis für eine generell anwendbare Methode,” sagte Agostinelli. “Wir glauben, dass, da nur ein Ziel-Zustand und ein Verfahren zu arbeiten rückwärts von diesem Ziel Stand, nicht nur KI-algorithmen lernen, einen Weg zu finden, um das Ziel, es kann lernen, dies in die effizienteste Art und Weise möglich.”
Von hier aus, die UCI-Forscher wollen das ändern der DeepCubeA Algorithmus, um andere Aufgaben durchzuführen, wie protein-Struktur-Vorhersage, die nützlich sein könnten für die Entwicklung neuer Medikamente. Sie würde auch gern das system nutzen, um den Pfad zu finden-Fähigkeiten zu helfen, Roboter navigieren effizienter in komplexen Umgebungen.
Teilen Sie Diese Geschichte