Foto: Getty
Sidste år, Canada indført et nyt lotteri system, der bruges til at forlænge et permanent opholdstilladelse til forældre og bedsteforældre for Canadiske statsborgere. Processen blev udviklet til at vælge et tilfældigt ansøgere med henblik på at gøre processen mere retfærdig end den gamle første-mølle-system. Der er bare ét problem: den software, der bruges til at køre lotteri er faktisk ikke tilfældig.
The Globe and Mail rapporterede den Indvandring, Flygtninge og Medborgerskab Canada (IRCC) bruger Microsoft Excel til at køre indvandring lotteri at vælge 10.000 mennesker for permanent opholdstilladelse fra et felt på omkring 100.000 ansøgninger, der modtages hvert år. Eksperter advarede om, at de tilfældige tal generere funktion i Excel, der ikke er faktisk tilfældige og kan sætte nogle ansøgere til en ulempe.
For det første, er det bedst at forstå, hvordan lotteri system, der virker. En Adgang til Oplysninger efter anmodning indgivet af The Globe og Mail, viser, at IRCC input anvendelsen nummer for hver person, der indgår i lotteriet i Excel, så tildeler dem en tilfældig nummer til hver bruger en variant af program RAND kommando. Derefter sortere listen fra mindste til største, der er baseret på de tilfældige tal, der er tildelt og tage de første 10.000 applikationer med de laveste numre.
Systemet sætter en masse tro på Excel ‘ s tilfældig rækkefølge-funktion, som det måske ikke fortjener. Ifølge Université de Montréal datalogi-professor Pierre L’Ecuyer, Excel er “meget dårlige” til at generere tilfældige tal, fordi det bygger på en gammel generator, der er ude af dato. Han advarede også om, at Excel ikke videregive statistiske tests og er mindre tilfældige, end det ser ud, hvilket betyder, at nogle mennesker i lotteriet kan faktisk have en lavere chance for at blive valgt end andre.
Her er hvordan problemet manifesterer sig, per Globe and Mail:
Excel anvender pseudo-tilfældige tal generatorer, en klasse af algoritmer, der er afhængige af formler til at generere tal. Disse generatorer er en afgørende fejl – de er afhængige af en “frø” antal til kick off matematisk proces. I tilfælde af Excel, er dette frø, der genereres automatisk af programmet. “Hvis du kender et nummer på et trin,” Prof. L’Ecuyer forklarede, “du kan beregne alle de numre, der vil følge efter.”
Fordi de fleste af tilfældige tal generatorer bruge algoritmer, der producerer længere, værdier bestemmes af indledende kortere værdier, de fleste computer-processer, der anses for at være pseudo-snarere end helt tilfældigt. Men Excel er ofte ikke engang producere gode pseudotilfældige resultater og til tider har det været så slemt, at programmører kan foretage reverse engineering af resultaterne. Et team af kryptografer på University of Haifa i Israel var i stand til at forudsige antallet af softwaren vil generere, ved at bestemme den oprindelige værdier, som det er at arbejde med.
B. D. McCullough, professor ved LeBow College of Business på Drexel University, undersøgt Microsoft ‘ s reviderede tal generator, der blev implementeret i Excel 2007, og fandt det der mangler så godt. “Brugere af Excel’ s ‘rand’ funktion har været at bruge tilfældige tal fra en ukendt og udokumenterede RNG af ukendt periode, som ikke er kendt for at passere en standard test af tilfældighed,” sagde han om processen.
Excel ‘ s tilfældig rækkefølge-funktion er blevet forbedret over tid, men det er stadig anses for at være utilstrækkelige, især til et formål, der er så følsom som bestemmelse af en person, der er berettiget til status som fastboende udlænding. L’Ecuyer fortalte The Globe og Mail, at regeringen kunne bruge gratis kryptografiske generatorer, der er tilgængelige online, og det ville producere mere retfærdige resultater end Excel. “Noget ville være bedre,” sagde han.
Det ville tage et vist kendskab til programmet, og forsøg på at manipulere Excel for at favorisere visse ansøgere, men muligheden foreligger. Det burde være nok til at overbevise regeringen til at forfølge andre muligheder, men IRCC synes at være tilfreds med sin nuværende Excel-baseret system.
“Vi står ved denne randomiseret udvælgelse proces som en tilstrækkelig hjælp af lige muligheder for alle, der ser til at udtrykke en interesse i at sponsorere deres forældre og bedsteforældre,” en talsmand for IRCC sagde i en erklæring til The Globe and Mail. Agenturet har også sagt, at der ikke er nogen indikation af, at systemet er blevet manipuleret, og ligesom Excel ‘ s random number generator, der bliver nødt til at være god nok.
[The Globe and Mail]