Företaget Baidu, som ofta kallas “Kinesiska Google”, har publicerat ett white paper, som fokuserar på den senaste utvecklingen inom området artificiell intelligens (AI). Systemet är baserat på ett neuralt nätverk som kan klona en mänsklig röst på grundval av analysen av även mycket kort bit av källmaterial. Programmet är inte bara mycket bra härmar av mänskligt tal, men också kan ge sina egna egenheter som accent.
Exempel på imitation av mänskliga röster, neurala nätverk kan ses genom att klicka på denna länk.
Tidigare versioner av denna teknik gör det möjligt att skapa imitation av mänskligt tal baserat på analys av längre prover. I 2017, det team av ingenjörer från Baidu Djup Röst har infört en teknik som kan härma mänskligt tal på grundval av en 30-minuters källmaterial. Konkurrenskraftiga utvecklingen inom detta område, i sin tur, gjorde några snabbare. Till exempel programmet VoCo från Adobe kan efterlikna mänskligt tal baserat på en 20-minuters demo. Och utveckling av Lyrebird kanadensiska start har visat prov på en ännu mer fantastisk möjlighet – att hon hade några minuter ursprungliga provet av den mänskliga rösten för att skapa sin simulering. Den nya designen också Baidu gick ännu längre – det är nog bara ett par sekunder på det ursprungliga materialet.
Vid första anblicken kan det tyckas att dessa tekniker är till någon praktisk användning – så en njutning. Men detta är en missuppfattning. I framtiden kommer denna teknik att verkligen hitta den sfär som de kan använda. Tänk dig en person som har förlorat förmågan att tala och om igen att det har uppnåtts, även med bil. Eller sjukt barn, som inte vill ligga i sängen tills du hör din röst läser en berättelse, även om du är långt bort och du har bara ingen fysisk möjlighet att ringa honom. Detta är bara en liten del av de möjligheter som kan öppna upp denna teknik.
Dessutom är denna teknik kan användas, exempelvis, för att skapa personliga digitala assistenter som kan prata med dig riktig människa och inte en dator röst.
Men, som någon annan teknik, även här, har sin baksida. Vi kan ta itu med sitt missbruk och användning är inte helt lagliga syften. Portalen New Scientist rapporterade att den nuvarande versionen av programmet har lyckats skapa en typ av röst som när du checkar voice recognition system i 95 procent av fallen kunna ljuga för henne. Och folk är så allmänt uppskattade kvaliteten på de klonade prover av 3.16 poäng av 4. Den takt som förr eller senare kan vi möter fall av bedrägeri med hjälp av artificiell intelligens, sade journalister.
I världen finns det redan program som använder neurala nätverk kan förändras eller till och med härma mänskliga ansikten i videon. Nu till exempel, Internet är översvämmad med pornorolikov i modeller ersätts av kändisar. Naturligtvis, allt detta är ändå bara en vanlig upptåg, men snart, i kombination med teknik som kan mycket exakt efterlikna en viss röst, vi kan möta en annan våg av “falska nyheter”, där framstående personer från olika områden och politiker kommer att säga saker som de aldrig skulle säga i verkligheten.
Många människor nu kan luras med hjälp av en till synes vanliga program som Photoshop. Tänk vilka problem vi kan stöta på när den orsaken kommer att ta hamnar i fel händer, artificiell intelligens, miljarder gånger utöver funktionerna i photoshop.
Baidu har skapat ett program som kan klona din röst på bara några sekunder
Nikolai Khizhnyak