Google DeepMind neurale netværk lært at vende 2D-billeder i tre-dimensionelle objekter

Kigger på billedet, vil enhver let være i stand til at forestille sig, hvad der er afbildet på det som en tre-dimensionel billede. Og selv om nogle af de objekter bag kulisserne (for eksempel, ser vi kun den forreste del af ryggen af stolen, men ikke kan se bagsiden), vi er ganske let at gætte, hvordan det vil se ud i motivet på bagsiden. AI er en så kompliceret tricks, men for nylig, en gruppe af projektet ingeniører DeepMind ikke kun undervist i kunstig intelligens til at gøre ovenstående, men også at oversætte den 2D-billede i fuld 3D.

Et nyt system kaldet “Skabe netværk anmodninger” (Generativ Forespørgsel Netværk — GQN). At undervise i kunstig intelligens til at analysere to-dimensionelle scener, et hold forskere viste ham billeder af den samme scene fra forskellige synsvinkler. Denne kæde af billeder AI, der anvendes for at forstå princippet i objekt ændres, når du ændrer vinkel. Desuden er, denne tilgang gav mulighed for at lære at forudsige, hvordan vil scenen, se ud fra en anden vinkel, ikke blot under hensyntagen til placeringen af objekter, men også belysning. Som rapporteret af en af de forfattere Ali Eslami,

“Forestil dig, at du kigger på mount Everest og flytte til måleren. Bjerget ikke vil ændre dens størrelse, hvilket vil give dig oplysninger om afstanden til og størrelsen. Men hvis man ser på krus og gør det samme – det vil ændre sig. Ca og vores teknologi.”

“Desuden er den algoritme, der lærer på samme måde som mennesker. At se de samme ting mange gange, AI analyserer dens egenskaber, husker og bruger derefter gentagne interaktion. Nu, kunstig intelligens kan genskabe en labyrint, scanning lige et par fotos taget inde.”

Google DeepMind neurale netværk lært at vende 2D-billeder i tre-dimensionelle objekter
Vladimir Kuznetsov