Forskare utveckla enheten som kan “höra” din inre röst

Nytt headset kan lyssna till inre vocalisation och tala till bäraren samtidigt som syns tyst till omvärlden

Fre 6 Apr 2018 13.15 BST

Senast ändrad Fre 6 Apr 2018 13.16 BST

MIT’s AlterEgo headset can ‘hear’ internalised voices and speak to the user through a bone-conduction system.

Forskare har skapat en bärbar enhet som kan läsa människors sinnen när de använder en inre röst, som tillåter dem att styra enheter och ställa frågor utan att tala.

Enheten, som kallas AlterEgo, kan transkribera ord som bärare verbalisera internt, men säg inte det högt, med hjälp av elektroder som fästs på huden.

“Vår idé var: kan vi ha en plattform som är mer interna, som melds människa och maskin på vissa sätt och som känns som en inre förlängning av vår egen kognition?” sade Arnav Kapur, som ledde utvecklingen av systemet på MIT ‘ s Media Lab.

Kapur beskriver de headset som en “intelligens-augmentation” eller IA enhet, och det är på grund av att presenteras vid Association for Computing Machinery är Intelligent Användargränssnitt för konferensen i Tokyo. Det bärs runt käken och hakan, klippt över toppen av örat för att hålla den på plats. Fyra elektroder under vit plast enhet ta kontakt med huden och plocka upp den subtila neuromuskulära signaler som aktiveras när en person verbalises internt. När någon säger orden inne i huvudet, artificiell intelligens inom enheten kan matcha speciella signaler till särskilt ord, utfodra dem till en dator.

Facebook

Twitter

AlterEgo demonstration video.

Datorn kan sedan svara genom enheten med hjälp av ett benledningsimplantat högtalare som spelar upp ljud i örat utan att de behöver ett par hörlurar till införas, lämnar bäraren gratis att få höra resten av världen på samma gång. Tanken är att skapa en utåt tyst dator-gränssnittet som endast bäraren av AlterEgo enheten kan tala till och höra.

“Vi i princip inte kan leva utan våra mobiltelefoner, i våra digitala enheter. Men vid den tidpunkten, användning av dessa produkter är mycket störande,” sade Pattie Maes, professor i media arts and sciences vid MIT. “Om jag vill se något som är relevant för en konversation jag är med, jag måste hitta min telefon och ange lösenordet och öppna en app och skriv in några nyckelord, och det hela kräver att jag helt skifta uppmärksamhet från min omgivning och de människor som jag är med att själva telefonen.”

Maes och hennes studenter, inklusive Kapur, har varit att experimentera med nya format och gränssnitt för att tillhandahålla kunskap och tjänster för smartphones utan störande avbrott de för närvarande orsaken till det dagliga livet.

Den AlterEgo enhet hanteras i genomsnitt 92% transkription noggrannhet på en 10-person rättegång med ca 15 minuter för att anpassa till varje person. Det är flera procentenheter lägre än 95%-plus noggrannhet som Google voice transkription service kan med en vanlig mikrofon, men Kapur säger att systemet kommer att bli bättre noggrannhet under lång tid. Den mänskliga tröskeln för röst ordet noggrannhet är tänkt att vara ca 95%.

Kapur och team arbetar på att samla in data för att förbättra erkännande och bredda antalet ord AlterEgo kan upptäcka. Det kan redan användas för att styra en grundläggande användargränssnitt som Roku-streaming-system, flytta och välja innehåll, och kan känna igen siffror, spela schack och utföra andra grundläggande uppgifter.

Det slutliga målet är att göra samverkan med AI assistenter som Google ‘ s Assistant, Amazon Alexa eller Apples Siri mindre pinsamt och mer intim, gör det möjligt att kommunicera med dem på ett sätt som förefaller att vara tyst till omvärlden – ett system som låter som science fiction, men verkar fullt möjligt.

Den enda nackdelen är att användare kommer att behöva bära en anordning ont i ansiktet, ett hinder för smarta glasögon som Google Glas misslyckades med att övervinna. Men experter tror att tekniken har stor potential, inte bara i konsumenternas utrymme för aktiviteter såsom diktamen men också inom industrin.

“Skulle det inte vara bra att kommunicera med rösten i en miljö där du normalt inte skulle kunna?” sade Thad Starner, en design och professor vid Georgia Tech. “Du kan tänka på alla dessa situationer där du har en hög ljudnivå miljö, som cockpit på ett hangarfartyg, eller ens platser med en hel del maskiner, som ett kraftverk eller en tryckpress.”

Starner ser också ansökan i det militära och för dem med de villkor som hämmar normalt tal.

Forskare upptäcka hur hjärnan känner igen ansikten – genom att läsa djurens sinnen