Hur Cambridge Analytica vände Facebook “gillar” till en lukrativ politiskt verktyg

Den algoritm som används i Facebook dataintrång trålas om personuppgifter för information om sexuell läggning, ras, kön och även intelligens och barndomstrauma

Lör 17 Mar 2018 13.02 GMT

Senast ändrad Lör 17 Mar 2018 17.24 GMT

Spela Upp Video

13:04

Cambridge Analytica uppgiftslämnare: “Vi tillbringade $1m skörda miljontals Facebook profiler” – video

Algoritmen i hjärtat av Facebook dataintrång låter nästan för dystopiska för att vara verklig. Det trålar genom de till synes triviala, slit och släng inläggen –”gillar” användare dela ut när de besöker webbplatsen – för att samla in känslig personlig information om sexuell läggning, ras, kön, även intelligens och barndomstrauma.

Ett par dussin “likes” kan ge en stark förutsägelse av den part som en användare kommer att rösta för, avslöja sitt kön och om deras partner är sannolikt att vara en man eller kvinna, ge en kraftfull ledtrådar om huruvida deras föräldrar har bott tillsammans under hela sin barndom och förutsäga deras sårbarhet för missbruk. Och det kan göra allt detta utan att djupdykning i personliga meddelanden, inlägg, statusuppdateringar, foton eller annan information som Facebook har.

Vissa resultat kan låta mer som resultatet av uppdaterade online sleuthing än sofistikerad analys av data; “gilla” en politisk kampanj för att sidan är lite annorlunda från att nåla fast en affisch i ett fönster.

Avslöjat: 50 miljoner Facebook-profiler som har skördats för Cambridge Analytica i stora dataintrång

Läs mer

Men för fem år sedan psykologi forskare visade att långt mer komplexa egenskaper kan härledas från mönster som är osynliga för en mänsklig betraktare att skanna igenom profiler. Bara några till synes slumpmässiga “likes” kan utgöra grunden för störda av komplex karaktär bedömningar.

När användare gillade “curly fries” och Sephora kosmetika, detta sade han för att ge ledtrådar till intelligens, Hello Kitty gillar anges politiska åsikter; “att Vara förvirrad efter att vakna upp från naps” var kopplat till sexualitet. Dessa var bara några av de oväntade men konsekvent samband noteras i en artikel i tidskriften Proceedings of the National Academy of Sciences tidning i 2013. “Få användare som var förknippade med “gillar” uttryckligen att avslöja deras attribut. Till exempel, mindre än 5% av användarna har märkts som bög var i samband med uttryckligen homosexuella grupper, såsom Nr H8 Kampanj,” peer-reviewed forskning som finns.

Forskarna, Michal Kosinski, David Stillwell och Thore Graepel, såg den dystopiska potential av studien och tagit upp integritetsfrågor. På den tiden Facebook “gillar” är offentliga som standard.

Spela Upp Video

13:04

Cambridge Analytica uppgiftslämnare: “Vi tillbringade $1m skörda miljontals Facebook profiler” – video

“Den förutsägbarhet för enskilda egenskaper från digitala register av beteenden kan få betydande negativa konsekvenser, eftersom det lätt kan tillämpas på ett stort antal människor utan deras individuella samtycke och utan att de märker,” sade de.

“Kommersiella företag, statliga institutioner, eller ens dina Facebook-vänner kan använda programvara för att härleda egenskaper såsom intelligens, sexuell läggning eller politiska åsikter som en individ kanske inte har tänkt att dela med sig.”

Vissa, som kanske lät som en affärsmöjlighet. Senast i början av 2014, Cambridge Analytica VD Alexander Nix hade tecknat avtal med en av Kosinski ‘s Cambridge kollegor, föreläsare Aleksandr Kogan, för en privat kommersiell satsning, separat från Kogan uppgifter på universitetet, men ekande Kosinski’ s arbete.

Den akademiska hade utvecklat en Facebook-app som innehöll en personlighet frågesport, och Cambridge Analytica betalt för människor att ta den, reklam på plattformar såsom Amazon Mechanical Turk.

Appen som registreras resultaten av varje frågesport, insamlade data från taker ‘ s Facebook – konto, och, framför allt, extraherade data av sina Facebook vänner.

Resultaten var ihop med varje quiz-taker ‘ s Facebook-uppgifter för att söka efter mönster och bygga en algoritm för att förutsäga resultatet för andra Facebook-användare. Sina vänners profiler lämnat ett försöksområde för formel och, ännu viktigare, en resurs som skulle göra den algoritm som politiskt värdefull.

Dr Aleksandr Kogan

Aleksandr Kogan

För att vara berättigad att ta testet användaren var tvungen att ha ett Facebook-konto och vara en för OSS väljare, så att tiotals miljoner av de profiler som kan matchas till röstlängden. Från en inledande prövning 1 000 “seeders”, forskarna fick 160,000 profiler – eller cirka 160 per person. Så småningom ett par hundra tusen betalas test-tagare skulle vara nyckeln till data från ett stort stråk av OSS väljare.

Det var mycket lockande. Det kan också anses olaglig, främst på grund av att Kogan inte har tillåtelse att samla in eller använda uppgifter i kommersiella syften. Hans tillåtelse från Facebook till skörd profiler i stora mängder var särskilt har begränsats till akademisk användning. Och även om bolaget vid tidpunkten tillåtna appar för att samla in data vän, det var endast för användning i samband med Facebook själv, för att uppmuntra till interaktion. Säljer data på, eller sätta det till andra ändamål, inklusive Cambridge Analytica är politisk marknadsföring – var strikt spärras.

Det verkar också sannolikt att projektet var att bryta Brittiska lagar om skydd för personuppgifter, som förbjuder försäljning eller användning av personuppgifter utan samtycke. Det finns fall där samtycke ges för ett syfte, men uppgifter används för annan.

Den betalas test-tagare undertecknat T&Cs, inklusive insamling av sin egen data, och Facebook är standard villkor accepteras av sina vänner data samlas in genom en app, såvida inte deras sekretessinställningar tillåter detta. Men ingen av dem gick med på att deras data eventuellt användas för att skapa ett politiskt verktyg för marknadsföring eller för att den släpps ut i en stor kampanj databas.

Kogan underhåller allt han gjorde var lagligt och säger att han hade en “nära samarbete” med Facebook, som hade gett honom tillstånd för sina appar.

Facebook förnekar detta var ett dataintrång. Vice ordförande Paul Grewal sade: “Skydd av information är kärnan i allt vi gör, och vi kräver samma sak av människor som verkar appar på Facebook. Om dessa rapporter är sant, det är ett allvarligt missbruk av våra regler”.

Grafik för att visa viktiga spelare i Cambridge Analytica historia

Omfattningen av datainsamlingen Cambridge Analytica betalt för var så stor att den utlöste en automatisk avstängning av app är möjligheten att skörda profiler. Men Kogan berättade en kollega att han “talade med en ingenjör” för att få den begränsning som lyfte, och inom en dag eller två, arbetet återupptas.

Inom några månader, Kogan och Cambridge Analytica hade en databas med miljoner av OSS väljare som hade sin egen algoritm för att scanna dem, identifiera sannolika politiska övertygelser och personlighetsdrag. De kunde sedan bestämma vem som ska mål och hantverk sina meddelanden som sannolikt att vädja till dem – en politisk strategi som kallas “micro-targeting”.

Facebook meddelade på fredagen att det var upphävande av Cambridge Analytica och Kogan från plattformen i avvaktan på information om användning av uppgifter som är relaterade till detta projekt.

Facebook förnekar att avverkning av tiotals miljoner profiler av GSR och Cambridge Analytica var ett dataintrång. Det sade i ett uttalande att Kogan “fick tillgång till denna information på ett legitimt sätt och genom rätt kanaler” men “inte därefter följa våra regler” eftersom han passerade information till tredje part.


Date:

by