For at robotized mekanisme lært at gå, kan du ikke bare “lægger” til det et par fødder. Træning af bevægelighed er en meget kompleks proces, der kræver, at udviklerne en masse tid. Men nu er dette spørgsmål vil løse den kunstige intelligens, fordi gruppen af eksperter, der havde skabt en universel algoritmer, der hjælper AI læring robotter enhver konfiguration til at flytte. Den menneskelige indgriben i denne proces er ikke påkrævet.
Udviklingen er et team af forskere fra University of California i Berkeley og en gruppe af eksperter Google Hjernen, og et af forsknings-divisioner af Google på kunstig intelligens. Deres nye system har uddannet fire-benede robot til at krydse terræn, som kendte og ukendte.
“Dybt styrkelse læring kan bruges til at automatisere en række opgaver. Hvis vi kan lære robotten gangart fra bunden i den virkelige verden, kan vi skabe controllere, hvilket er ideelt tilpasset til hver robot, og endda til de enkelte landskaber, så du kan opnå de bedste manøvredygtighed, effektivitet og pålidelighed.” — siger forskerne.
Styrkelse læring er grundlæggende en metode til gulerødder og stokke, som er skræddersyet til AI. Det bruger en belønning eller straf i at nå eller ikke nå mål.
“Dybt styrkelse læring er almindeligt anvendt til uddannelse AI, og selv for overførsel af data til den rigtige robotter, men dette vil uundgåeligt medfører nogle resultater tab på grund af uoverensstemmelser i modellering og kræver en aktiv indsats. Brugen af sådanne algoritmer, der i realtid var en vanskelig opgave.”
For forsøg, forskerne tog robotten Minitaur. De har udviklet et system, der består af en arbejdsstation, som er opdaterede data af de neurale netværk, der hentes oplysninger i Minitaur og losset tilbage. Chip NVIDIA Jetson TX2 om Bord af robotten var ansvarlig for behandling af oplysninger. Robotten gik 2 timer og lavet 160 000 skridt. I løbet af denne tid, den algoritme, der er givende robotten til at bevæge sig fremad og blev straffet, hvis han var gået på plads, eller har gjort en meget stor rulle til side. I sidste ende, blev der skabt en bevægelse algoritme, der må robotten til at vælge den optimale bane.
“Så vidt vi ved, er dette eksperiment er det første eksempel på anvendelse af forstærkning for at lære, som giver dig mulighed for at lære robotten til at gå.”
Endnu mere interessant og eksklusive nyheder om emnet AI og høj teknologi, som du kan læse i vores news kanalen i Yandex.Zen.