Chinesische Entwickler gelehrt, die KI der menschlichen Stimme sprechen

Experten der chinesischen Labor Baidu Research, im Besitz der größten such-Riese China, erstellt der Algorithmus AI Deep Voice, fähig konvertieren Text-to-speech. Ähnliche Projekte aus der Zeit vor dieser, konfrontiert mit dem Problem der Geschwindigkeit der Klangsynthese, also zur Erzeugung der Stimme Vorgängern Deep Vice brauchte mehrere Minuten bis ein paar Stunden, um richtig und möglichst naturalistisch wiederzugeben Text mit menschlicher Stimme in Sprache. Die neue Entwicklung der chinesischen Wissenschaftler basiert auf neuronalen Netzen und ist in der Lage Umwandlung von Text in Sprache in Echtzeit.

Deep Voice in der Lage zu imitieren die Klangfarbe, die intonation der Stimme und der Akzent macht Sie sehr glaubwürdig und fast nicht zu unterscheiden von den echten, bei dieser Stimme kann einen männlichen oder weiblichen. Die Entwickler wissen, dass Ihre Technologie können als Digital assistants, gelten für die Aufnahme von Stimmen in идеоиграх oder gar nutzen für die Simultanübersetzung Filme nach Untertiteln.

«Es ist ein echter Durchbruch aus technischer Sicht, denn wir konnten bei der sehr komplizierte Problem, синтезировав die lebendige Sprache mit all seinen Funktionen», sagt Leo Zou, einer der Autoren des Projekts.

Die Macher des Algorithmus erklärt, dass das Projekt Deep Voice inspiriert von ähnlichen Entwicklungen, hier sind alle Komponenten laufen mit dem neuronalen Netz, wobei unter Verwendung der in der Arbeit eine ziemlich einfache Funktion, dass der Algorithmus macht Sie sehr anpassungsfähig — Stimme kann so konguriert werden, «unter sich», indem er das System mit neuen Akzenten und anderen Besonderheiten.

«Tiefe Ausbildung führte zu einer Revolution in verschiedenen Bereichen wie Computer Vision und Spracherkennung, und jetzt ist die Zeit und Sprachsynthese. Wir freuen uns, in der Lage, solche Ergebnisse zu erzielen, und wir werden weiter arbeiten, um das System «Text-Stimme» noch realistischer», führt Motherboard Zitat der Entwickler.

Nicht zu vergessen unser телеграм-tschatik!

Chinesische Entwickler gelehrt, die KI der menschlichen Stimme sprechen
Vyacheslav Larionov


Date:

by