Hur fungerar det? | Maskinöversättning

För första gången idén om att använda elektroniska datorer för översättning av texter som var uttryckt i 1947 i Usa, omedelbart efter uppkomsten av den första datorn. Den första offentliga demonstration av maskinöversättning ägde rum 1954. Det systemet var mycket primitiva: det hade ett ordförråd på endast 250 ord, 6 grammatiska regler, och kunde översätta några enkla fraser. Men experimentet har fått stor uppmärksamhet: började sin forskning i länder runt om i världen, inklusive i Sovjetunionen. Hur fungerar en modern maskin översättningssystem — detta är aktuellt idag!

I hjärtat av moderna system är baserat på översättning algoritm som använder en formell grammatik, språk och statistik. Att lära sig ett språk, jämför systemet tusentals parallella texter som innehåller samma information men på olika språk. För vart och ett av de studerade sms: a, systemet bygger en lista med unika funktioner. Till exempel, sällan använda ord och specialtecken som visas i sms: a med viss frekvens.

I system för maskinöversättning, som regel av tre huvudsakliga delar: översättning modell, språk modell och dekoder. Översättning modell är en tabell där alla ord och fraser på ett språk som är möjliga översättningar till ett annat språk med en indikation på sannolikheten för att dessa överföringar. Systemet jämför inte bara enstaka ord utan även fraser av flera ord i följd. Modell översättning för varje par av språk innehåller miljontals par av ord och fraser. Som för språk modell, det skapas av systemet i det skede av att studera texter.

Översatt av dekodern. Han utför morfologisk och syntaktisk analys av text och för varje mening plockar upp alla översättningar är sorterade i fallande ordning av sannolikhet. Då alla alternativ dekodern uppskattningar, med hjälp av den modell av språket på frekvensen av användningen och väljer det förslag, med den bästa kombinationen av sannolikhet och frekvens.

Av maskinöversättning system kan användas, inte bara för texter, men för att översätta enstaka ord. De innehåller full ordböcker med detaljerad kort av ord och uttryck. Dessa kort-systemet är baserat på statistiska data, baserat på de regler i språket. För machine ordlista här markerar bara ordlistan form av ord och uttryck. Systemet utför morfologisk och syntaktisk analys, bestämmer den del av tal, lexikal form av ordet, och sätter gränser för fraser. Denna information hjälper till att sålla ut ofullständiga fraser. För att undvika fel och stavfel, en algoritm baserad på maskininlärning teknik som undersöker alla möjligheter översättning par och eliminerar opålitliga.

Liknande värdeöverföringar är grupperade i systemet genom att använda ordböcker av synonymer. I dem är ord som ofta översätts till ett annat språk lika eller bilda en fras med samma ord. Resultatet är en maskin ordbok får allt han behöver veta om varje ord och uttryck till sin grundform, ordklass, betydelser och synonymer. Vissa system, för tydlighetens skull, lägga till översättningar av exemplen är hämtade från parallella texter.

Användning av statistik som gör det möjligt för system för maskinöversättning för att ändra språk. Om människor börja att skriva ett ord på ett annat sätt, systemet ser det, så snart som det blir nya texter. För att förbättra kvaliteten på översättningen systemet uppdateras regelbundet och utföra inspektioner. Men högkvalitativa maskin översättning av texter som är svårfångade. Men det väsentligt underlättar och påskyndar arbetet till översättare.

Hur fungerar det? | Maskinöversättning
Hej-News.ru


Date:

by