Deze Geanimeerde AI-Bots Geleerd om Zich Kleden, Onhandig

Na Miljoenen Proeven, Deze Gesimuleerde Mensen Geleerd om te Doen Perfecte Backflips en Radslagen

Met behulp van gevestigde machine learning technieken, onderzoekers van de Universiteit van Californië,…

Lees meer Lees

Het verschil met zelf-dressing, echter, is de noodzaak voor haptische waarneming. Geanimeerde karakters moeten het aanraken van hun kleding af te leiden van de vooruitgang. Als dressing zelf, de bots moeten de kracht om te bewegen hun virtuele armen door de kleding, terwijl het vermijden van de krachten die schade kunnen toebrengen aan het kleed, of veroorzaken van een hand of elleboog vast komen te zitten. Bijgevolg hadden de onderzoekers voor het toevoegen van een tweede belangrijk element van het project: een physics engine die het simuleren van de trekken, rekken, en manipulatie van buigzaam materiaal, namelijk doek.

Tijdens de training proces, een bot behaalde punten door succesvol aan te pakken de rand van een sleeve of porren zijn hoofd door de kraag. Maar wanneer een actie resulteerde in scheuren of het aan de armen hopeloos verward, zou het verliezen van punten.

Uw browser ondersteunt geen HTML5 video tag.Klik hier om de originele GIFIn dit voorbeeld van een mislukte dressing poging, de bot tranen een gat door middel van het shirt. GIF: Alexander Clegg/GIT/Gizmodo

Zeer snel in het project, echter, de onderzoekers realiseerde zich dat een enkele, coherente dressing beleid niet werkt. De ingewikkelde taak van kleden moest worden opgesplitst in een reeks van sub-beleid. Maar dit is dan zinvol, wanneer leren we kinderen om zich kleden, we leren het een stap op een moment. De wet van de dressing kan niet worden opgesplitst in een enkele filosofische beleid—het is een stap-voor-stap proces dat leidt in de richting van een gewenst doel. Clegg ‘ s team een beleid ontwikkeld-sequencing algoritme voor dit doel; op een bepaald stadium, een geanimeerde bot wist waar het was in de dressing proces, en die stap was de volgende zodanig dat het zou kunnen gaan in de richting van het gewenste doel.

Clegg en zijn collega ‘ s zeggen dat hun nieuwe papier is de eerste om aan te tonen dat reinforcement learning, in combinatie met een doek simulatie kan worden gebruikt om te leren een “robuuste dressing beleid van de controle” te bots, zelfs al is het “noodzakelijk om te scheiden van de dressing taak in verschillende subtaken” en het systeem “leren beleid van de controle voor elke subtaak” om het te laten werken, de auteurs schrijven in de studie.

Nog belangrijker, de studie was beperkt tot het bovenlichaam taken; het uitvoeren van een lager lichaam dressing taken zouden zijn van de invoering van een geheel nieuwe set van complicaties, zoals het handhaven van het evenwicht met het aantrekken van een broek. Ook was het systeem voor de computer veeleisende. Uiteindelijk zouden de onderzoekers willen nemen van het geheugen in het systeem, dat kan “het verminderen van het aantal noodzakelijke subtaken en grotere generalisatie van de geleerde vaardigheden,” de auteurs schrijven. Inderdaad, als de peuter die al snel verwerft competentie en flexibiliteit door middel van ervaring, de onderzoekers willen hun systeem om hetzelfde te doen.

Als laatste opmerking, deze studie toont aan hoe moeilijk het zal zijn om te algemeen maken van kunstmatige intelligentie. Het was een overwinning van het AI-onderzoek naar het maken van machines die in staat zijn het verslaan van grootmeesters op schaken en Go, maar het creëren van systemen die kunnen uitvoeren van meer alledaagse taken zoals aankleden zelf—blijkt het een enorme uitdaging.

[Georgia Institute of Technology]

Deel Dit Verhaal