Hvorfor er AI stadig ikke mestrer oversættelse sprog?

I myten om babelstårnet de mennesker, der har besluttet at bygge et tårn by, der ville komme til himlen. Og så er Skaberen indså, at intet ville afskrække folk og forestiller sig, de er ikke værd at den gider. Så Gud skabte forskellige sprog, for at forhindre, at mennesker og at de ikke længere kunne nemt at arbejde sammen. I dag, takket være teknologi, har vi hidtil uset tilslutning. Men vi lever stadig i skyggen af babelstårnet. Sprog er fortsat en barriere i forretning og marketing. På trods af det faktum, at teknologiske hjælpemidler kan nemt forbinde mennesker fra forskellige dele af verden, ofte ikke kan.

Oversættelse forsøger at fange: give præsentationer, aftaler, vejledning, outsourcing og reklame for alle. Nogle bureauer tilbyder også såkaldte “lokalisering”. For eksempel, hvis en virksomhed går til markedet i Quebec, er det nødvendigt reklamer på Quebec fransk, ikke Europa fransk. Selskabet kan lide på grund af forkert oversættelse.

Globale markeder venter, men en engelsk oversættelse af de kræfter, at kunstig intelligens er endnu ikke klar, på trods af de seneste fremskridt i naturligt sprog forarbejdning og følelser analyse. AI er stadigvæk har problemer med behandling af anmodninger selv i et sprog, endsige oversættelse. I November 2016, har Google tilføjet et neuralt netværk i din oversætter. Men nogle af hendes oversættelser er stadig socialt og grammatisk mærkeligt. Hvorfor?

“Til kredit for Google, at selskabet har indført en hel masse forbedringer, der er dukket op næsten natten. Men jeg kan ikke rigtig bruge dem. Sproget er svært,” siger Michael Dahl, ledende forsker, forskning RapportBoost.AI og foredragsholder, Singularity University.

Han forklarer, at det ideelle scenarie for maskinindlæring og kunstig intelligens vil være faste regler og klare kriterier for succes eller fiasko. Skak er et oplagt eksempel, og sammen med dem og th. Computer hurtigt styr på disse spil, fordi reglerne er klare og skarpe, og de bevæger sig er begrænset.

“Sproget er næsten det stik modsatte. Der er ingen klare og præcise regler. Samtalen kan gå i en uendelig række af forskellige retninger. Og selvfølgelig er du også nødt mærket data. Du er nødt til at fortælle maskinen, hvad hun gør, er rigtigt og hvad er forkert.”

Hausman bemærkes, at den mark på det sprog, de oplysninger, etiketter fundamentalt svært. “To tolke er i stand til at blive enige om den korrekte oversættelse,” siger han. “Sprog er Vilde Vesten fra en data-perspektiv”.

Google er nu i stand til at forstå de forslag, som helhed, uden at forsøge at oversætte de enkelte ord. Men fejl kan der stadig ske. Meifod Joerg, lektor i spansk, specialist i latinsk litteratur ved Universitetet i Jacksonville forklarer, hvorfor præcise oversættelser er ikke givet kunstig intelligens:

“Problemet er, at for at forstå sætningen som helhed mangler. Ligesom betydningen af ordet afhænger af resten af sætningen (primært på engelsk), betydningen af en sætning afhænger af resten af afsnittet, og teksten som helhed, og værdien af den tekst, afhænger af den kultur, intentioner, højttaler og andre ting. Sarkasme og ironi, for eksempel, har kun mening i en bredere sammenhæng. Idiomer kan også være problematisk for computer-aided translation”.

“Google oversættelse er et fantastisk værktøj, hvis du bruger den som et værktøj, der ikke forsøger at erstatte menneskelig læring eller forståelse,” siger han. “For et par måneder siden gik jeg til at købe en boremaskine på Home Depot og læse indskriften under bilen: “Så maskinen”. (Maskine saw). Nedenfor var den spanske oversættelse af “La maquina vió”, som betyder “den Bil er set.” “Saw” er ikke oversættes med et substantiv og et verbum i datid”.

Dr. Mahfud advarer: “Vi har brug for at vide om den skrøbelighed, der er i denne fortolkning. Fordi at oversætte er væsentligt at fortolke, ikke blot den idé, men en følelse. Menneskelige følelser og ideer, som kan forstås kun af mennesker — og nogle gange endda, at vi, folket, ikke kan forstå andre mennesker.”

Han bemærkede, at kultur, køn og alder selv kan skabe hindringer for, at denne forståelse, og den store afhængighed af teknologi fører til vores kulturelle og politiske fald. Dr. Mahfud nævnt, at den Argentinske forfatter Julio Cortázar kaldet ordbøger “kirkegårde”. Automatiske oversættere, der kunne kaldes en “zombie”.

Eric Cambria, akademiker, forsker AI, og Professor af den Teknologiske Universitet Nanyang i Singapore, er engageret i det meste af naturligt sprog forarbejdning, og som er grundlaget for oversættere på grundlag af AI. Som Dr. Mahfud, han ser den kompleksitet og de risici, der er forbundet i denne retning. “Der er så mange ting, som vi gør ubevidst, når vi læser teksten”. Læsning kræver udførelse af mange ikke-relaterede opgaver, som ikke er i henhold til gældende automatiske oversættere.

“Det største problem for maskinoversættelse i dag er, at vi har en tendens til at gå fra syntaktisk form af sætninger i sproget input til den syntaktiske form af denne sætning på målsproget. Vi mennesker behøver ikke at gøre det. Vi først afkode betydningen af en sætning i input-sprog, og derefter indkode denne værdi i det pågældende sprog”.

Hertil kommer, at der er kulturelle risici, der er forbundet med disse overførsler. Dr. Ramesh Srinivasan, Direktør for Laboratoriet digitale kulturer på University of California i Los Angeles, siger, at de nye teknologiske værktøjer til tider afspejler den underliggende fordomme.

“Der skal være to parametre, som afgør, hvordan vi designer “intelligente systemer”. Den ene er værdier og, så at sige, volumenbestemmelse af den, der skaber systemet. Den anden er en verden, hvor systemet vil lære. Hvis du er ved at skabe AI-system, der afspejler den bias af dets Skaber, og i resten af verden, til tider spektakulære fejl”.

Dr. Sivanesan ‘ siger, at oversættelsesredskaber skal være gennemsigtige i forhold til muligheder og begrænsninger. “Ser du, den idé, at et system kan tage en sprog (hvilket er meget forskellige semantisk og syntaktisk) og kombinere dem, eller i hvilket omfang, at generalisere, eller selv lave en, det er latterligt”.

Mary Cochran medstifter Lancere Marketing Labs, ser kommercielle muligheder for vækst. Hun bemærkede, at listerne på online markeder som Amazon kan i teorien automatisk at oversætte og optimere for kunder i andre lande.

“Jeg tror, at vi nu har kun rørt toppen af isbjerget, så at sige om, hvad AI kan gøre med markedsføring. Og med forbedret oversættelse og globalisering i verden AI kan ikke føre til, at den eksplosive vækst i markedet”.

Hvorfor er AI stadig ikke mestrer oversættelse sprog?
Ilya Hel


Date:

by