Künstliche Intelligenz gelernt hat, richtig zu erkennen, um es unter Lärm

Virtuelle Assistenten und Spracherkennung gut genug gelernt haben «zu lernen», was Ihnen der Mann sagt und befolgt seine Befehle. Aber für den korrekten Betrieb derselben Siri und Cortana Nebengeräusche kann ein großes Problem werden. Zur Bewältigung dieser technischen Fehler können helfen die Experten von Mitsubishi Electric, präsentierten die neue Technologie Ausfluss der Rede einer Person aus dem Allgemeinen Lärm.

Die Technologie des japanischen Unternehmens hat den Namen Deep Clustering, der Betrieb beruht auf den Grundsätzen der maschinellen Studie. Künstliche Intelligenz für den Anfang gelernt, selbständig auszuscheiden Rede eines einzelnen aus dem Allgemeinen Strom der verschiedenen Klänge und Geräusche. Neuronales Netz trennt eingehende Audiodaten auf verschiedene Elemente analysiert und jeder einzelne dann schon verarbeiten kann die Stimme einer Person. Diese Art der Arbeit beobachtet und beim «Beitritt» zwei und mehr Gesprächspartnern.

Während der Demonstration der Technologie des japanischen Unternehmens konnte das System erfolgreich teilen die Rede von zwei Menschen sprechen in ein Mikrofon ein und dasselbe Angebot in verschiedenen Sprachen. Die gesamte Verarbeitung erfolgte in Echtzeit, und die Latenz nicht höher als drei Sekunden. Die Genauigkeit der Erkennung von Betrug 90 Prozent, und wenn in das Mikrofon zu sprechen begann drei Personen, der Anteil der «Treffer» fiel bis zu 80, was auch ein gutes Ergebnis. Wie sagen die Autoren des Projekts Vétroz Anthony und Йохеи OKATO,

«Im Gegensatz zu den Absonderungen der Rede von Hintergrundgeräuschen, die Zuweisung der Rede einer Person aus dem «Voice» Geräusche gleichzeitig sprechenden Menschen ist eine komplexe Aufgabe, da Tönen die Stimmen der verschiedenen Menschen gibt es eine Masse Eigenschaften. In den meisten Systemen die Aufgabe, die Trennung der Stimme gelöst Hilfe bei Installation von zwei oder mehr Mikrofonen, aber im Falle der Verwendung nur eines Mikrofons, mit der Aufgabe, die Trennung der Stimme umgehen kann nur die künstliche Intelligenz. Diese Technologie nutzen können dort, wo eine hohe Genauigkeit der Erkennung von Sprachnachrichten. Z. B. bei der Sprachsteuerung Autos, Aufzügen, Haushaltsgeräten und anderen elektronischen Geräten».

Künstliche Intelligenz gelernt hat, richtig zu erkennen, um es unter Lärm
Vladimir Kuznetsov