Skapad av en talsyntes baserat på AI som kan spela någon röst

Nästan alla befintliga virtuella assistenter, oavsett hur avancerade funktioner som de kan ha, har mycket märkligt “maskinen” röst, som har något att förvirra. Detta inträffar från det faktum att den röst synthesizer som används för tal som förinspelade fraser, ljud och kombinationer av dessa. Som föreslagits av några experter på området, förbättra ljudkvalitet kan uppnås med hjälp av artificiell intelligens, och visat att bolagets Lyrebird från Montreal. Deras utveckling kan återge en röst för en person.

Att följa rösten systemet tar bara några sekunder av ljud inspelning av röst som krävs av en person på grundval av vilket kommer att skapa en ljud-snutt. Exakt imitation av röst är möjligt genom användning av neurala nätverk som bygger på artificiell intelligens och som arbetar enligt samma principer som neurala nätverk av den mänskliga hjärnan. AI lär sig att känna igen drag av mänskligt tal, och då dessa uppgifter redan som används för syntes av en syntetisk röst. Nu är det nya systemet är fortfarande inte utan sina brister: det finns problem med förståelse av talat-tal, det är “röst artifacts” och en del andra tecken som pekar på att ett uttalande maskinen. De kan dock lätt elimineras i framtiden, för nu fungerar systemet i realtid. Enligt en av sponsorerna Jose Sotelo,

“Vårt program var utbildad på ett stort antal ljud-fragment av tal av tusentals olika människor. Den information som erhålls är komprimerade för att bilda en slags “röst DNA”, som är en digital nyckel. Sedan, på grundval av denna nyckel systemet kan återge några ord, även de som inte var inblandade i den process av lärande.”

Författarna till utkastet till förstår att rätt nivå av utveckling av denna teknik för att undvika säkerhetsproblem. Till exempel, för att kringgå system för att identifiera användaren med hjälp av rösten. Företagets representanter Lyrebird jämföra sin uppfinning med uppfinningen av photoshop. När du skapar ett program från Adobe, blev det svårt att lita på bilderna på skärmen. Nu kan du inte lita på rösten.

“Vi förstår att på grund av den höga nivå av utveckling av modern teknik såsom en röst synthesizer komma fram i ljuset förr eller senare. Vi uppmuntrar alla att börja vägra att godta som bevis för en mängd olika ljud-inspelningar, samt med hjälp av korrigerande åtgärder på basis av röst.”

I alla fall, det är inget att oroa sig så mycket eftersom systemet är väldigt råa och talsyntes som låter ändå “robot” – lappar. För att se hur systemet Lyrebird återger röster Barack Obama, Donald trump och flera andra politiker, kan du följa denna länk.

Skapad av en talsyntes baserat på AI som kan spela någon röst
Vladimir Kuznetsov