Praktisch alle derzeit existierenden virtuellen Assistenten, was auch erweiterte Funktionen, die Sie noch hatten, haben äußerst seltsame «maschinelle» Stimme, die mit nichts zu verwechseln. Dies geschieht aus der Tatsache, dass Sprach-Synthesizer verwendet für die Rede Satz von vorab aufgezeichneten Phrasen, Klänge und Ihre Kombinationen. Wie manche Experten in diesem Bereich, zur Verbesserung der Klangqualität erzielen Sie durch den Einsatz der künstlichen Intelligenz, und gezeigt, dass Unternehmen Lyrebird aus Montreal. Ihre Entwicklung wiedergeben kann die Stimme einer Person.
Für die Imitation der Stimme von System reicht nur wenige Sekunden Audioaufnahme der Stimme der gewünschten Person, auf deren Basis erstellt wird und Klänge. Die genaue Nachahmung der Stimme möglich durch den Einsatz von neuronalen Netzen auf Basis von künstlicher Intelligenz, die auf denselben Prinzipien aufbauen, dass das neuronale Netz des menschlichen Gehirns. Die KI lernt erkennen, die Eigenschaften der Menschen die Rede, und dann diese Daten werden bereits für die Synthese von künstlichen Stimme. Jetzt die Arbeit des neuen Systems immer noch nicht ohne Nachteile: es gibt Probleme mit der Verständlichkeit Rede gesprochen, sind «Voice-Artefakte» und einige andere Anzeichen, die darauf hinweisen, dass die Worte spricht die Maschine. Aber Sie alle können problemlos in der Zukunft beseitigt sind, denn schon jetzt arbeitet das System in Echtzeit. Wie sagt einer der Autoren des Projekts Jose Sotelo,
«Unser Programm wurde auf einer großen Anzahl von аудиофрагментов Auftritte von tausenden verschiedenen Menschen. Die erhaltenen Informationen schrumpft auf die Art eine Art «Sprach-DNA», das ist ein digitaler Schlüssel. Dann auf der Grundlage dieses Schlüssels das System spielt alle Wörter, auch diejenigen, die nicht beteiligt waren im Laufe der Ausbildung».
Selbst die Autoren des Projekts sind sich bewusst, dass mit dem richtigen Maß an der Entwicklung dieser Technologie nicht vermeiden Probleme mit der Sicherheit. Zum Beispiel für die Umgehung von Benutzerkennung Stimme. Vertreter des Unternehmens Lyrebird vergleicht seine Erfindung mit der Erfindung von Photoshop. Nach dem erstellen des Software-Pakets von Adobe wurde schwer Vertrauen Bilder auf dem Bildschirm. Jetzt zu Vertrauen und nicht der Stimme.
«Wir verstehen, dass wegen des hohen Niveaus der Entwicklung der modernen Technologien eine solche Sprach-Synthesizer kam, auf das Licht früher oder später. Wir fordern alle beginnen verweigern die Annahme als Beweismittel verschiedenen Audio-Aufnahmen, sowie die Verwendung der Mittel des Schutzes auf der Grundlage der Stimmen».
In jedem Fall bis früh kümmern, denn das System ist sehr roh, und in der «synthetischen» Stimmen klingen immer noch «Roboter-Notizen». Um zu untersuchen, wie das System Lyrebird spielt die Stimme von Barack Obama, Donald Trump und eine Reihe von anderen politischen Persönlichkeiten, können Sie unter diesem Link.
Erstellt Sprach-Synthesizer auf Basis der KI, die fähig ist, jede Stimme wiedergeben
Vladimir Kuznetsov