Virksomheder, der driver forretning online glip af milliarder i årligt salg takket være en fejl, der er at holde deres systemer, der er uforenelig med Internet-domænenavne lavet af ikke-latinske tegn. Fastsættelse det kunne også bringe en anden 17 millioner mennesker, der taler russisk, Kinesisk, arabisk, Vietnamesisk, og Indiske sprog online.
Det er konklusionerne i en ny undersøgelse af en industri-ledede gruppe sponsoreret af International Corporation for Assigned Names (ICANN), den organisation der er ansvarlig for at vedligeholde liste over gyldige Internet-domænenavne. Formålet med den såkaldte Universelle Accept styregruppe, som består af repræsentanter fra en række af Internet-virksomheder, herunder Microsoft og GoDaddy, er at tilskynde til, software-udviklere og udbydere til at opdatere, hvordan deres systemer validere streng af tegn til højre for punktummet i et domæne-navn eller e-mail—adresse-også kaldet top-level domæne.
Fejlen var ikke et indlysende problem indtil 2011, hvor ICANN besluttet til dramatisk at udvide området for, hvad der kan vises til højre for prik (se “ICANN’ s Boondoggle”). Mellem 2012 og 2016, antallet af top-level-domæner eksploderet fra 12 til over 1.200. Det omfatter 100 “internationaliserede” – domæner, der har en ikke-latinske script, eller med latinske bogstaver med diakritiske tegn, som en umlaut (), eller ligaturer, som den tyske Eszett (ß). Nogle 2,6 millioner internationaliserede domænenavne er registreret under den nye top-level domæner, som hovedsagelig er koncentreret i den russiske og Kinesiske sprog, ifølge ny undersøgelse.
Mange Web-applikationer eller e-mail-klienter genkende top-level-domæner, som kun gyldige, hvis de er sammensat af tegn, der kan kodes ved brug af American Standard Code for Information Interchange, eller ASCII. Problemet er mest udtalt med e-mail-adresser, som er nødvendige legitimationsoplysninger for at få adgang til online bank konti og sociale medier sider ud over at sende beskeder. I 2016-gruppen testede e-mail-adresser med ikke-latinske tegn til højre for dot og fandt accept af mindre end 20 procent.
Den bug fix, som indebærer en ændring af de grundlæggende regler, der validere domæner, så de kan acceptere Unicode, en anden standard til kodning af tekster, der virker for mange flere sprog, er relativt ligetil, siger Ram Mohan, styregruppen ‘ s formand. Den nye forskning tyder på, at de potentielle økonomiske fordele af at gøre det rette er større end omkostningerne. Alt for mange virksomheder, herunder e-handel virksomheder, e-mail tjenester, og banker, der blot endnu ikke er klar over, at deres systemer ikke kan acceptere disse nye domæner, siger Mohan.
Tingene bliver bedre, selv. I 2014, Google opdateret Gmail til at acceptere og vise internationaliserede domænenavne uden at skulle stole på en upraktisk løsning, der kunne oversætte tegnene i ASCII. Microsoft er i færd med at opdatere sin e-mail-systemer, som indeholder Outlook-klienter og dets cloud-baseret tjeneste, til at acceptere internationaliserede domænenavne og e-mail-adresser.
Det handler ikke kun om den nederste linje, siger Mark Svancarek, en program manager for kunde-og partner oplevelse hos Microsoft, og en, der er næstformand for den Universelle Accept styregruppen. At lade millioner af mennesker blive holdt tilbage fra Internettet, fordi “det tegnsæt, der er volapyk for dem,” er antitesen til hans virksomhedens mission, siger han.
Accept af ikke-ASCII-domæner, der er tilbøjelige til at anspore Internet vedtagelse, da en stor del af den næste milliard mennesker, der ventes at oprette forbindelse til Internettet overvejende tale og skrive på deres lokale sprog, siger Mohan. Adgangen til disse mennesker vil afhænge på mange måder om de grundlæggende antagelser, der regulerer de grundlæggende funktioner på Internettet, siger han. “Problemet her er, at på nogle måder er doven programmering, og fordi det er dovne programmering, er det nemt at udskifte det med en bedre programmering.”