Virtuelle assistenter og stemmegenkendelse godt nok lært at “vide”, hvad de person siger, og følger hans befalinger. Men for at dette arbejde er den samme for Siri og Cortana, baggrundsstøj kan blive et stort problem. For at klare denne tekniske fejl kan hjælpe med eksperter fra Mitsubishi Electric, der præsenterede en ny teknologi til at fremhæve indlæg af en person fra den Almindelige støj.
Teknologi af Japansk firma, der hedder Dyb Clustering, som er bygget på principperne for machine learning. Kunstig intelligens til at starte med, jeg lærte at skelne indlæg af en person fra den Generelle strøm af forskellige lyde. Det neurale netværk, der deler den indgående lyd data til forskellige elementer og analyserer hver for sig, hvorefter den kan behandle stemmen på en mand. Et sådant arbejde er observeret og “deltage” to eller flere samtalepartnere.
I løbet af den teknologi demonstration Japanske virksomheder, systemet var i stand til at adskille tale af to højttalere i en mikrofon én og samme sætning på forskellige sprog. Al forarbejdning blev udført i realtid, og den forsinkelse, der ikke overstiger tre sekunder. Anerkendelse nøjagtighed var 90 procent, og når mikrofonen begyndte at tale med tre personer, er andelen af “hits” faldt til 80, hvilket er også et godt resultat. Hvordan at fortælle, forfatterne af projektet, Anthony Vetro, Yohei OKATO,
“I modsætning til adskillelsen af indlæg fra baggrundsstøj, udvælgelsen af indlæg af en person fra “voice” af den støj, der af folk, der taler på samme tid, er en skræmmende opgave, som lyden af stemmer, af forskellige mennesker, som har en masse funktioner. I de fleste systemer til opgave at adskille stemmerne er løst ved at installere to eller flere mikrofoner, men i tilfælde af, at ved hjælp af kun én mikrofon, med den opgave at adskille de stemmer, der kan håndtere kun kunstig intelligens. For at bruge denne teknologi er muligt med en høj anerkendelse nøjagtigheden af talebeskeder. For eksempel, voice control systemer i biler, elevatorer, apparater og andre elektroniske enheder.”
Kunstig intelligens til at lære at genkende tale blandt støj
Vladimir Kuznetsov