Microsoft er conversational speech recognition system – utviklet for å nøyaktig gjenkjenner ordene i en samtale som mennesker gjør – har nådd et 5.1 prosent feil pris, laveste så langt.
Denne milepælen betyr at for første gang, en datamaskin kan gjenkjenne ord i en samtale, så vel som en person ville.
“Vår forskning laget nådde at 5.1 prosent feil med vår speech recognition system, en ny industri milepæl, vesentlig overgår korrektheten vi oppnådd det siste året,” Microsoft kunngjorde i en blogg-innlegg sent på søndag.
Siste år i oktober, team fra Microsoft Kunstig Intelligens og Forskning rapportert en tale gjenkjennelse system som gjør det samme eller færre feil enn profesjonelle skrivere.
Forskerne hadde da rapportert et ord feil (WER) på 5,9 prosent.
“Siste året, Microsoft’ s tale og dialog research group annonserte en milepæl i arbeidet med å nå menneskelige paritet på ‘Sentralbord’ conversational talegjenkjenning oppgave, som betyr at vi hadde skapt teknologi som gjenkjente ord i en samtale, så vel som profesjonell menneskelig avskrivere,” sa Xuedong Huang, Teknisk Krabat, Microsoft.
‘Sentralbord’ er et korpus av innspilte telefonsamtaler at tale forskningsmiljøer har brukt for mer enn 20 år å benchmark talegjenkjenning systemer.
Oppgaven innebærer å transkribere samtaler mellom fremmede å diskutere temaer som for eksempel sport og politikk.
Teamet brukte “Microsoft Kognitiv Toolkit 2.1” (CNTK), den mest skalerbare dyp læring programvare som er tilgjengelig, for å utforske modell arkitekturer.
I tillegg, Microsoft ‘ s investering i compute cloud infrastruktur, spesielt Azure Gpuer, bidratt til å forbedre effektiviteten og hastigheten.
Nå menneskelige paritet med en nøyaktighet på linje med mennesker, har blitt en forskning som mål for de siste 25 årene.
“Microsoft vilje til å investere i langsiktig forskning er nå betaler utbytte for våre kunder produkter og tjenester som Cortana, Presentasjon Oversetter, og Microsoft Kognitiv Tjenester,” post-lese.
“Å flytte fra erkjennelsen av å forstå tale er den neste store milepæl for tale-teknologi,” innlegget er lagt til.