Experten der Suchmaschinen-Riese Google veröffentlicht einen Artikel, in dem gesagt wurde, dass der generator erstellt die Rede, fähig zu sprechen ununterscheidbar von einer lebenden Person eine Stimme. Entwicklung heißt Tacotron 2 und in der Lage, sehr effizient zu konvertieren Text-to-speech.
Das Programm besteht aus zwei miteinander verbundenen нейросети Deep learning. Die erste нейросеть erstellt auf der Grundlage der Text-Spektrogramm und übergibt diese dem zweiten Algorithmus WaveNet, der Sie und die Stimme der «Stimme». Tacotron 2 kennt viele Nuancen, ohne Schwierigkeiten zurechtkommt in der Aussprache mit komplexen Worten und durch das Lesen vom Blatt, Interpunktion berücksichtigt. Dadurch, zum Beispiel, Sie nimmt das Ende eines Satzes und den Beginn eines neuen, Hervorhebung Ihrer Tongebung.
Arbeitsproben App-Spezialisten bereits auf der Seite gepostet, gewidmet der Entwicklung. Klingt es viel besser als die monotone, mechanische Stimme von modernen scoring-Programme, deshalb müssen Sie glauben, Google schnell findet Anwendung Entwicklung. WaveNet wird bereits in Google Assistant, daher Tacotron 2 wird sicherlich für Sie eine große Bereicherung.
In dieser Phase der Entwicklung Tacotron 2 spricht nur von einer angenehmen Frauenstimme, aber wahrscheinlich in der Zukunft erhalten und die männliche Variante, und in Anbetracht Ihrer Fähigkeit zu lernen, vielleicht lernen und andere Stimmen zu imitieren.
Google “Sprach” der menschlichen Stimme
Vyacheslav Larionov