Autodidatta AI Maestri del Cubo di Rubik Senza l’Aiuto dell’Uomo

Illustration for article titled Self-Taught AI Masters Rubik’s Cube Without Human Help Immagine: AP

Fantasia algoritmi in grado di risolvere un Cubo di Rubik sono apparsi prima, ma un nuovo sistema presso l’Università di California, Irvine, usa l’intelligenza artificiale per risolvere il puzzle 3D da zero e senza obbligo di aiutare gli esseri umani—e lo fa con una velocità impressionante e di efficienza.

Una nuova ricerca pubblicata questa settimana in Natura la Macchina di Intelligenza descrive DeepCubeA, un sistema in grado di risolvere qualsiasi confusa, il Cubo di Rubik è presentato con. Più impressionante, è possibile trovare il percorso più efficiente per il successo—che è la soluzione che richiede il minor numero di mosse—circa il 60 per cento del tempo. In media, DeepCubeA necessari a soli 28 anni si muove per risolvere il puzzle, che necessitano di 1,2 secondi per calcolare la soluzione.

Article preview thumbnail

Guarda Questa Macchina Risolvere un Cubo di Rubik più Veloce Rispetto al Mio Mascella Può Cadere

Circa un anno fa, nel marzo scorso, un robot chiamato Sub1 risolvere un Cubo di Rubik in 0.637-i secondi…

Per saperne di più Leggere

Suoni veloce, ma altri sistemi di aver risolto il puzzle 3D in meno tempo, tra cui un robot in grado di risolvere il cubo di Rubik in soli 0.38 secondi. Ma questi sistemi sono stati progettati specificamente per l’attività, risorse umane in script di algoritmi per risolvere il puzzle nel modo più efficiente possibile. DeepCubeA, d’altra parte, ha insegnato per sé a risolvere il Cubo di Rubik, utilizzando un approccio di intelligenza artificiale nota come il rafforzamento dell’apprendimento.

“L’intelligenza artificiale è in grado di sconfiggere il migliore del mondo di scacchi umano e i giocatori, ma alcuni più puzzle difficile, come il Cubo di Rubik, non era stato risolto da computer, così abbiamo pensato che erano aperti per AI approcci”, ha detto Pierre Baldi, autore senior della nuova carta, in un comunicato stampa. “La soluzione del Cubo di Rubik coinvolge più simbolici, matematici e il pensiero astratto, così un apprendimento profondo macchina in grado di decifrare un puzzle è sempre più vicino a diventare un sistema in grado di pensare, ragionare, pianificare e prendere decisioni.”

Infatti, un esperto, un sistema progettato per un compito e un compito solo—come risolvere un Cubo di Rubik—sarà sempre limitata al dominio, ma un sistema come DeepCubeA, con il suo personale altamente adattabile rete neurale, potrebbe essere utilizzato per altre attività, come la soluzione di complessi scientifici, matematici e problemi di ingegneria. Cosa c’è di più, questo sistema “è un piccolo passo verso la creazione di agenti che sono in grado di imparare a pensare e progettare per se stessi in nuovi ambienti,” Stefano Grasso, un co-autore della nuova carta, ha detto a Gizmodo.

Il rafforzamento dell’apprendimento funziona il modo in cui suona. I sistemi sono motivati a raggiungere un obiettivo designato, durante i quali si guadagnano punti per la distribuzione di azioni o strategie, e perdere punti per allontanarsi fuori corso. Questo permette di algoritmi per migliorare nel tempo, e senza l’intervento umano.

Di apprendimento di rinforzo senso per un Cubo di Rubik, a causa dell’orribile numero di possibili combinazioni 3x3x3 rompicapo, che ammontano a circa il 43 quintilioni. Semplicemente per la scelta casuale si muove con la speranza di risolvere il cubo non è semplicemente di andare a lavoro, né per l’uomo né il più potente supercomputer.

DeepCubeA non è la prima su punizione, il possibile per queste Università della California, Irvine ricercatori. Il loro precedente sistema, chiamato DeepCube, usato una convenzionale albero-strategia di ricerca e di apprendimento di rinforzo schema simile a quello impiegato da DeepMind è AlphaZero. Ma mentre questo approccio funziona bene per one-on-one giochi da tavolo come gli scacchi e Go, si è dimostrato goffo per il Cubo di Rubik. Durante le prove, la DeepCube sistema richiesto troppo tempo a fare i suoi calcoli e le sue soluzioni, spesso lontano dall’essere ideale.

L’UCI team ha utilizzato un approccio diverso con DeepCubeA. Partire con un risolto il cubo, il sistema di mosse casuali per rimescolare il puzzle. In sostanza, ha imparato a operare al Cubo di Rubik da giocare in retromarcia. Prima le mosse erano pochi, ma caotici stato fatto più e più complicato, in quanto la formazione progredito. In tutto, DeepCubeA giocato 10 miliardi di combinazioni diverse in due giorni, come è lavorato per risolvere il cubo in meno di 30 mosse.

“DeepCubeA tentativi di risolvere il cubo con il minor numero di mosse”, ha spiegato Grasso. “Di conseguenza, i movimenti tendono a guardare molto diverso da come un uomo in grado di risolvere il cubo”.

Dopo l’allenamento, il sistema è stato incaricato di risolvere i 1.000 casualmente strapazzate Cubi di Rubik. Nei test, DeepCubeA trovato una soluzione per il 100% di tutti i cubi, e ha trovato un percorso più breve verso l’obiettivo stato il 60,3 per cento del tempo. Il sistema richiesto 28 si muove, in media, per risolvere il cubo, che ha fatto in circa 1,2 secondi. Per confronto, l’uomo più veloce del mondo puzzle solver richiedono circa 50 mosse.

“Da quando abbiamo scoperto che DeepCubeA è risolvere il cubo nel minor numero di mosse 60 per cento del tempo, è abbastanza chiaro che la strategia che si sta utilizzando è vicino al la strategia ottimale, noto comunemente come “algoritmo di Dio”,” studio co-autore della Foresta Agostinelli detto Gizmodo. “Mentre umane strategie sono facilmente spiegabile con passo-passo le istruzioni, la definizione di una strategia ottimale richiede spesso sofisticate conoscenze di teoria dei gruppi e calcolo combinatorio. Anche se matematicamente la definizione di questa strategia non è nello scopo di questo articolo, possiamo vedere che la strategia DeepCubeA impiego è uno che non è immediatamente evidente per l’uomo.”

Per mostrare la flessibilità del sistema, DeepCubeA è stato anche insegnato per risolvere altri enigmi, tra cui scorrevoli-tessera di puzzle, giochi di Luci, e Sokoban, che ha fatto con simili competenze.

“Abbiamo applicato il nostro algoritmo per un totale di sette enigmi e ha scoperto che era in grado di risolverli tutti. Quindi, questo è la prova di una più generale applicabili metodo”, ha detto Agostinelli. “Crediamo che, dato un solo obiettivo e un metodo di lavoro all’indietro da quell’obiettivo stato, non solo in grado di algoritmi di intelligenza artificiale imparare a trovare un percorso verso la meta, si può imparare a farlo nel modo più efficiente possibile”.

Da qui, l’UCI ricercatori vorrei modificare il DeepCubeA algoritmo per eseguire altre operazioni, come la previsione della struttura delle proteine, che potrebbe essere utile per lo sviluppo di nuovi farmaci. Si piacerebbe anche utilizzare il percorso del sistema-ricerca di competenze per aiutare i robot di spostarsi in modo più efficiente in ambienti complessi.

Condividi Questa Storia


Date:

by