Foto: Getty
Vorig jaar, Canada introduceerde een nieuwe loterij systeem gebruikt voor het uitbreiden van permanent resident status van de ouders en grootouders van de Canadese burgers. Het proces is ontworpen om willekeurig te selecteren kandidaten in volgorde om het proces eerlijker dan de oude first-come, first-served systeem. Er is slechts één probleem: de software die gebruikt wordt voor het uitvoeren van de loterij is eigenlijk niet willekeurig.
De Globe and Mail meldde de Immigratie, Vluchtelingen en Burgerschap Canada (IRCC) maakt gebruik van Microsoft Excel voor het uitvoeren van de immigratie loterij te selecteren op de 10.000 mensen voor permanent resident status van een gebied van ongeveer 100.000 ontvangen aanvragen per jaar. Deskundigen waarschuwden dat het random getal genereren functie in Excel is eigenlijk niet willekeurig en kunnen sommige mensen in een achterstandssituatie.
Ten eerste, het is best te begrijpen hoe de loterij systeem werkt. Een Toegang tot de Informatie-aanvraag ingediend door De Globe and Mail blijkt dat IRCC ingangen van de toepassing nummer voor elke persoon invoeren van de loterij in Excel, dan wijst ze een willekeurig nummer met elk een variatie van de programma ‘ s RAND opdracht. Zij sorteren de lijst van kleinste naar grootste gebaseerd op de willekeurige nummer en neem de eerste 10.000 aanvragen met de laagste nummers.
Het systeem brengt een hoop van het geloof in de Excel-random-functie, die het niet zou verdienen. Volgens de Université de Montréal computer science professor Pierre L’Ecuyer, Excel is “zeer slecht” op het genereren van willekeurige getallen, omdat het gebaseerd is op een oude generator die is verouderd. Hij waarschuwde ook dat Excel niet voorbij statistische tests en is minder willekeurig dan het lijkt, wat betekent dat sommige mensen in de loterij kan zelfs een lagere kans hebben om geselecteerd te worden dan anderen.
Hier is hoe het probleem zich manifesteert, per De Globe and Mail:
Excel maakt gebruik van pseudo-random number generators, een klasse van algoritmen die zijn gebaseerd op formules voor het genereren van nummers. Deze generatoren zijn een belangrijke fout – ze vertrouwen op een “zaad” – nummer voor de aftrap van het wiskundig proces. In het geval van Excel, dit zaad is automatisch gegenereerd door de applicatie. “Als je weet dat een aantal in één stap,” Prof. L’Ecuyer uitgelegd, “kunt u berekenen met alle nummers die zal volgen.”
Omdat de meeste random number generators gebruiken algoritmen die de productie van meer waarden bepaald door de initiële kortere waarden, de meeste computer processen worden beschouwd als pseudo-in plaats van het echt willekeurig. Maar Excel heeft vaak niet, zelfs het produceren van goede pseudo-resultaten en soms is het zo erg dat programmeurs reverse engineering van de resultaten. Een team van cryptographers aan de Universiteit van Haifa in Israël waren in staat om te voorspellen van de nummers van de software zou kunnen genereren door het bepalen van de initiële waarden dat het werkt.
B. D. McCullough, een professor aan de LeBow College of Business van de Drexel University, onderzocht de Microsoft vernieuwde number generator geïmplementeerd in Excel 2007 en vond het ontbreekt ook. “Gebruikers van Excel ‘rand’ – functie zijn met behulp van random getallen uit een onbekende en onbeschreven RNG van een onbekende periode die niet bekend staat om de standaard tests van willekeur,” zei hij over het proces.
De Excel-random-functie is verbeterd in de tijd, maar het is nog steeds beschouwd als onvoldoende, zeker voor een doel zo gevoelig als het bepalen van een persoon in aanmerking komt voor een permanente verblijfsstatus. L’Ecuyer vertelde De Globe and Mail, kan de overheid gebruik maken van gratis cryptografische generatoren die online beschikbaar zijn en het zou produceren eerlijkere resultaten dan Excel. “Alles beter zou worden,” zei hij.
Het zou wel enige kennis van het programma en de inspanning om het te bewerken Excel om de gunst van bepaalde kandidaten, maar de mogelijkheid bestaat. Dat moet voldoende zijn om de regering ervan te overtuigen om naar andere opties, maar IRCC lijkt tevreden met de huidige Excel-gebaseerd systeem.
“We staan met dit gerandomiseerde selectie-proces een voldoende middelen van gelijke kansen voor allen die op zoek zijn naar een interesse in het sponsoren van hun ouders en grootouders,” een woordvoerder van IRCC zei in een verklaring aan De Globe and Mail. Het agentschap heeft ook gezegd: er is geen indicatie dat het systeem gemanipuleerd is en, net als de Excel-random number generator, die zal moeten worden goed genoeg.
[De Globe and Mail]