Google “talte” i en menneskelig stemme

Eksperter søgegiganten Google har offentliggjort en artikel, der talte om det faktum, at jeg har oprettet en tale-synthesizer stand til at tale, ikke kan skelnes fra en levende menneskelige stemme. Udviklingen kaldes Tacotron 2, og er i stand til meget effektivt at omdanne tekst til tale.

Programmet består af to indbyrdes forbundne neurale netværk dyb læring. De første neurale netværk, der genererer en tekst-baseret spectrogram og sender det til den anden algoritme WaveNet, der gav udtryk for sin “stemme”. Tacotron 2 kender en masse nuancer, nemt håndtere vanskelige udtale af ord og læsning fra et ark, tager hensyn til tegnsætning. På grund af dette, for eksempel, er det, der adskiller slutningen af en sætning og begyndelsen af en ny, der fremhæver deres intonation.

Arbejde prøver ansøgning specialister er allerede lagt ud på den side, der er dedikeret til udvikling. Det lyder meget bedre end den monotone robot stemmer af moderne lyde, og så, formentlig, Google vil hurtigt at finde den udvikling ansøgning. WaveNet er allerede bruges i Google-Assistent, så Tacotron 2 vil helt sikkert være et udmærket supplement.

I denne fase af udviklingen Tacotron 2 siger kun en behagelig kvindelig stemme, men formentlig i fremtiden vil få den mandlige version, og i betragtning af hendes evne til at lære, kan lære og efterligne andre stemmer.

Google “talte” i en menneskelig stemme
Vyacheslav Larionov


Date:

by