Microsoft Säger Att Deras System Taligenkänning Träffar Nya Noggrannhet Milstolpe

Microsofts konversera taligenkänning system för att exakt erkänner ord i en konversation som människor gör – har nått en 5,1 procent error rate, vilket är den lägsta hittills.

Denna milstolpe innebär att, för första gången, en dator kan känna igen orden i en konversation och en person skulle.

“Vår forskning laget nått som 5,1 procent felprocenten med våra system taligenkänning, en ny industri milstolpe, som väsentligt överträffar den noggrannhet som vi åstadkom förra året”, säger Microsoft i ett blogginlägg sent på söndagen.

Förra året i oktober, laget från Microsoft Artificiell Intelligens och Forskning redovisas för taligenkänning system som gör det samma eller färre fel än de professionella transcriptionists.

Forskarna hade sedan rapporterade en word error rate (WER) på 5,9 procent.

“Förra året, Microsofts tal och dialog forskargrupp presenterade en milstolpe för att nå mänskliga paritet på “Växel” för konversera taligenkänning uppgift, vilket betyder att vi hade skapat en teknik som redovisas ord i en konversation och professionella mänskliga avskrivare,” sade Xuedong Huang, Tekniska Kolleger, Microsoft.

Med “växel” är en samling av inspelade telefonsamtal som tal-forskningen har använts i mer än 20 år att jämföra taligenkänningssystem.

Uppgiften innebär att transkribera samtal mellan främlingar på att diskutera ämnen som sport och politik.

Laget som används för “Microsoft Kognitiva Toolkit 2.1” (CNTK), den mest skalbara deep learning programvara tillgängliga, för att utforska modell arkitekturer.

Dessutom, Microsofts investering i compute cloud-infrastruktur, särskilt Azure Grafikprocessorer, bidragit till att förbättra snabbhet och effektivitet.

Nå mänskliga paritet med en noggrannhet på par med människor har varit forskning målet för de senaste 25 åren.

“Microsoft är villiga att investera i långsiktig forskning är nu utdelning för våra kunder i produkter och tjänster såsom Cortana, Presentation Översättare, och Microsoft Kognitiva Tjänst, efter läs.

“Att gå från att erkänna att förstå tal är nästa stora utmaning för talteknologi,” post läggs till.


Date:

by