GOP Gegevens Onderneming per Ongeluk Lekken van Persoonlijke Gegevens van Bijna 200 Miljoen euro van de Amerikaanse Kiezers

Foto: Getty

Politieke gegevens verzameld over meer dan 198 miljoen burgers van de VS werd blootgesteld deze maand na een marketing bureau in opdracht van het Republikeinse Nationale Comité opgeslagen in de interne documenten op een voor het publiek toegankelijk Amazon server.

Het lekken van gegevens bevat een schat aan persoonlijke informatie op ongeveer 61 procent van de AMERIKAANSE bevolking. Samen met adressen, geboortedata en telefoonnummers, worden de records zijn geavanceerde sentiment analyses gebruikt door politieke groepen om te voorspellen waar individuele kiezers vallen op hot-knop problemen zoals wapenbezit, stamcelonderzoek, en het recht op abortus, evenals het vermoedelijke religieuze afkomst en etniciteit. De data werd vergaard uit een verscheidenheid van bronnen—van de verboden subreddit r/fatpeoplehate American Crossroads, de super PAC mede opgericht door voormalig Witte Huis strateeg Karl Rove.

Diep Wortel Analytics, een conservatieve gegevens onderneming waarmee het publiek voor het politieke advertenties, bevestigd eigendom van de gegevens Gizmodo op vrijdag.

UpGuard cyber risico analist Chris Vickery ontdekt Diep Wortel gegevens vorige week online. Meer dan een terabyte is opgeslagen op de cloud server zonder de bescherming van een wachtwoord en kan worden geopend door iedereen die de URL. Veel van de bestanden die niet van oorsprong in Diepe Wortel, maar in plaats daarvan in het totaal van buiten data bedrijven en Republikeinse super PACs, licht te werpen op de steeds meer geavanceerde data-ecosysteem dat geholpen voortbewegen President Donald Trump ‘ s slanke marges in de belangrijkste swing states.

Hoewel bestanden bezeten door Diepe Wortel zou typisch zijn voor een campagne, een Republikeinse of Democratische, zeggen de experts van de blootstelling in een enkele database openen verhoogt aanzienlijk de persoonlijke levenssfeer. “Dit is waardevol voor mensen die snode doeleinden,” Joseph Lorenzo Hall, de chief technologist bij het Center for Democracy and Technology, zei van de gegevens.

“Dit is waardevol voor mensen die snode doeleinden.”

De RNC betaald Diep Wortel $983,000 afgelopen jaar, volgens de Federale Verkiezingen verslagen van de Commissie, maar de server opgenomen records uit een verscheidenheid van andere conservatieve bronnen betaald miljoenen meer, met inbegrip van De Gegevens Trust (ook bekend als GOP Gegevens Trust), de Republikeinse partij primaire kiezer bestand provider. Gegevens Vertrouwen kreeg meer dan $6,7 miljoen uit de RNC tijdens de 2016-cyclus, volgens Open Secrets, en haar voorzitter, Johnny DeStefano, dient nu als Troef de directeur van de presidentiële personeel.

De Koch-broers’ politieke groep Americans for Prosperity, die had een data-swapping overeenkomst met Gegevens Trust in 2016 de verkiezingscyclus, droeg in hoge mate bij tot de blootgestelde bestanden, net als de markt onderzoeksbureau TargetPoint, wiens mede-oprichter voorheen werkzaam als directeur van Mitt Romney ‘ s strategie team. (Financiering van de Koch-broers ook aangedreven gegevens bedrijf bekend als i360, die begonnen met het uitwisselen van kiezer bestanden met Gegevens van Vertrouwen in 2014.) Bovendien, de bestanden die door Rove ‘ s American Crossroads bevatten strategische kiezer gegevens gebruikt voor het doel, onder andere, ontevreden Democraten en undecideds in Nevada, New Hampshire, Ohio, en andere belangrijke slagveld staten.

Diep Wortel verdere verkregen honderden bestanden (ten minste) van Het Kantar Groep, een toonaangevende media-en marktonderzoek bedrijf met kantoren in New York, Beijing, Moskou, en meer dan honderd andere steden op zes continenten. Elk bestand heeft een rijke details over politieke advertenties—de geraamde kosten, demografische informatie van de doelgroep, het bereik en meer van en over politieke figuren en groepen in het politieke spectrum. Er zijn bestanden op de Democratische Senaat Campagne Comité, Planned Parenthood, en de Amerikaanse Burgerlijke Unie van Vrijheden, als de bestanden op elke 2016 presidentskandidaat, Republikeinen opgenomen.

Wat meer is, het Kantar bestanden bevatten elk video-links naar verwante politieke advertenties opgeslagen op Kantar de servers.

Kantar bestanden op de politieke advertenties waarbij AMERIKAANSE functionarissen, kandidaten en politieke organisaties. (UpGuard)

Spreadsheets verworven van TargetPoint, die samen met een Diepe Wortel en de GOP Gegevens Trust in 2016, verkiezingen, zijn de adressen, geboortedata en partij voorkeuren van bijna 200 miljoen geregistreerde kiezers in 2008 en 2012 presidentsverkiezingen, evenals een aantal 2016 kiezers. TargetPoint de gegevens probeert op te lossen vragen over waar individuele kiezers staan op tientallen politieke kwesties. Bijvoorbeeld: Is de kiezer eco-vriendelijk? Doen ze het voordeel verlaging van de belastingen? Ze geloven dat de Democraten moeten staan tot Trump? Doen zij het eens zijn met de Bazuin “van Amerika op de Eerste” economische houding? Farmaceutische bedrijven doen grote schade: Eens of Oneens?

De details van de kiezers waarschijnlijk voorkeuren voor onderwerpen als het onderzoek naar stamcellen en gun control waren waarschijnlijk afkomstig uit een verscheidenheid van bronnen volgens een Democratische strateeg die sprak met Gizmodo.

“Die gegevens zoals die zou zijn een combinatie van opinieonderzoek, real world data van deur-kloppen en telefoon-bellen en andere commerciële prospectie activiteiten, in combinatie met de modellering met behulp van de gegevens die we al hebben te extrapoleren wat de kiezers dat weten we niet over zouden denken,” de strateeg zei. “De campagnes die het goed combineren van alle beschikbare gegevens samen te maken van de meest robuuste model voor elke kiezer in het doel universum.”

“We nemen de volledige verantwoordelijkheid voor deze situatie.”

In een verklaring, Diep Wortel-oprichter Alex Lundry vertelde Gizmodo, “Wij nemen de volledige verantwoordelijkheid voor deze situatie.” Hij zei dat de daarin opgenomen gegevens merkgebonden informatie publiekelijk beschikbaar kiezer gegevens verstrekt door de overheid en ambtenaren. “Aangezien deze gebeurtenis onze aandacht gekomen, we hebben een update van de toegang tot de instellingen en zet protocollen in de plaats om te voorkomen dat verdere toegang,” Lundry zei.

De diepe Wortel van de gegevens werd blootgesteld nadat het bedrijf bijgewerkt de beveiligingsinstellingen op juni 1, Lundry zei. Diep Wortel heeft behouden Stroz Friedberg, een cybersecurity en digitaal forensisch onderzoek bedrijf, te onderzoeken. “Op basis van de informatie die we hebben verzameld, zo ver weg, wij geloven niet dat onze systemen zijn gehackt,” Lundry toegevoegd.

Zo ver, Diep Wortel niet geloven dat haar eigen gegevens werd benaderd door een kwaadwillende derde partijen kunnen gedurende de 12 dagen dat de gegevens die op het open web.

Diep Root van de server werd ontdekt door UpGuard de Vickery in de nacht van 12 juni als hij op zoek was naar gegevens openbaar toegankelijk op Amazon ‘ s cloud-dienst. Hij gebruikt hetzelfde proces vorige maand op te sporen gevoelige bestanden gekoppeld aan een AMERIKAANSE Ministerie van Defensie project en belicht door een medewerker van een top verdediging aannemer.

Dit is niet de eerste lek van de kiezer bestanden ontdekt door Vickery, die vertelde Gizmodo dat hij was verontrust over hoe de gegevens blijkbaar wordt gebruikt—sommige lidstaten, bijvoorbeeld verbod op het commerciële gebruik van de kiezer records. Bovendien was het niet direct duidelijk wie de gegevens behoorde. “Er werd besloten dat de handhaving van de wet moet worden gecontacteerd alvorens u contact opnemen met de entiteit die verantwoordelijk is,” zei Vickery, die meldde dat de server is beveiligd twee dagen later, op 14 juni.

Een web van data ondernemingen trechter onderzoek naar campagnes

De diepe Wortel van de gegevens werpt licht op de steeds meer geavanceerde data-bewerking die gevoed recente Republikeinse campagnes en blootlegt het ingewikkelde netwerk van politieke organisaties, PACs en-analyse bedrijven die de handel in bulk kiezer gegevens. In een e-mail naar Gizmodo, Diep Wortel zei dat de kiezer modellen worden gebruikt voor het verbeteren van het begrip van de TV kijkerspubliek voor politieke ad kopers. “De gegevens toegankelijk was niet gebouwd voor of gebruikt worden door een specifieke klant,” Lundry zei. “Het is onze eigen analyse te helpen informeren de lokale televisie advertentie te kopen.”

Echter, de aanwezigheid van de gegevens op de server van verschillende politieke organisaties, waaronder TargetPoint en Gegevens van Vertrouwen, suggereert dat het werd gebruikt voor de Republikeinse politieke campagnes. Diep Wortel ook werkt voornamelijk met GOP klanten (hoewel soortgelijke leveranciers, zoals NationBuilder, dienst van de Democraten).

Diep Wortel is één van de drie data-bedrijven ingehuurd door de Republikeinse Nationale Comité in de aanloop naar 2016 de presidentsverkiezingen. Opgericht door Lundry, een data-scientist op de Jeb Bush en Mitt Romney-campagnes, het bedrijf was één van de drie analytics team dat werkte aan de Trump volgende campagne van de partij van de nationale conventie in de zomer van 2016.

Lundry werk bracht hem in Trump ‘s campagne war room, volgens een post-verkiezing Adagium artikel dat in kaart gebracht op de GOP’ s 2016 gegevens inspanningen. Diep Wortel was met de hand geplukt door de RNC ‘ s toenmalige chef-staf, Katie Walsh, in September van vorig jaar en kwam bij de twee andere gegevens winkels—TargetPoint Consulting en Causeway Oplossingen—in de poging om te winnen van Trump het voorzitterschap.

Walsh, die nu werkt voor de non-profit-Amerika Eerst Beleid na een korte periode in het Witte Huis, overzag Trump de gegevens van de werking in samenwerking met Brad Parscale, Trump ‘ s digital director. (Parscale niet reageren op een verzoek om commentaar voor druk op de tijd. Probeert te bereiken Walsh voor de reactie waren ook geen succes.) Walsh en Parscale zich gericht op drie categorieën van kiezers, Gezegde rapporten: kiezers die mogelijk vatbaar zijn voor ondersteuning van de Bazuin, de Republikeinse kiezers die waren onzeker over de Bazuin, en kiezers die leunend in de richting van Hillary Clinton, maar kon worden overgehaald door Trump ‘ s boodschap van het veranderen van regering-as-usual.

Een werkblad prognoses specifieke kiezers waarschijnlijk meningen over diverse onderwerpen gewogen met behulp van een 0-1 schaal. (UpGuard)

Om een beroep op de drie belangrijkste categorieën, blijkt dat Trump ‘ s team beroep op de kiezers van gegevens verstrekt door Gegevens Vertrouwen. Volledige kiezer rollen voor 2008 en 2012), evenals gedeeltelijke 2016 kiezer rollen voor Florida en Ohio, blijkbaar samengesteld door Gegevens van de Trust zijn opgenomen in de dataset die door de Diepe Wortel.

Gegevens Vertrouwen verwerft kiezer rollen van de staats-ambtenaren en vervolgens wordt de kiezer gegevens voor het maken van een schone, beheersbaar overzicht van alle geregistreerde ONS, de kiezers, een bron bekend met de firma ‘ s activiteiten vertelde Gizmodo. Kiezer gegevens zelf openbaar is en dus niet bijzonder gevoelig zijn, de bron toegevoegd, maar de tools Gegevens Trust gebruikt voor het standaardiseren van die gegevens worden beschouwd als eigen. Die gegevens worden dan op de politieke opdrachtgevers, waaronder google analytics-bedrijven als Diepe Wortel. Terwijl de Gegevens van Vertrouwen vraagt haar klanten om de gegevens te beschermen, is om klanten op hun woord dat de industrie-standaard versleuteling en beveiliging protocollen zijn plaats.

TargetPoint en Causeway, de twee bedrijven die worden tewerkgesteld door de RNC naast Diepe Wortel, blijkbaar gelaagde hun eigen analytics de top van de informatie verstrekt door de Gegevens Vertrouwen. TargetPoint uitgevoerd duizenden enquêtes per week in 22 staten, volgens Adagium, meten de kiezer het sentiment op een verscheidenheid van onderwerpen. Terwijl Causeway geholpen bij het beheren van de data, Diep Wortel gebruikt voor het perfecte haar TV-reclame doelen—het produceren van opkomst schattingen door de provincie en het gebruiken van die intelligentie om de doelgroep op de advertentie koopt.

Een bron met een jarenlange ervaring in het werken op een politieke campagne gegevens operaties vertelde Gizmodo dat de gegevens die door de Diepe Wortel leek te worden aangepast voor de RNC en had blijkbaar zijn gebruikt om modellen te maken voor de opkomst en voorkeuren van kiezers. Metadata in de bestanden gesuggereerd dat de database was niet Diep Wortel van de werkkopie, maar eerder een post-verkiezing versie van zijn gegevens, de bron zei, toevoegend dat was het enigszins verrassend de bestanden niet had weggegooid.

Omdat de gegevens van 2008 en 2012 de verkiezingen is verouderd—de bron ten opzichte van het naar de aard van de adres en telefoongegevens van de een kon vinden op een “slechte internet lookup-site”—het is niet erg waardevol. Zelfs de 2016 gegevens snel verouderd zijn. “Dit is een eigen dataset op basis van een mix van publieke gegevens, de gegevens van de commerciële aanbieders, en een verscheidenheid van voorspellende modellen van onzekere herkomst en kwaliteit,” de bron zei, toevoegend: “Ongetwijfeld heeft miljoenen dollars om te produceren.”

Hoewel basic kiezer informatie uit openbare bestanden, Diep Wortel van de dataset bevat een swirl van auteursrechtelijk beschermde informatie van de RNC gegevens van ondernemingen. Veel van bestandsnamen geven ze potentieel bevatten markt onderzoek op de Democratische kandidaten en de onafhankelijke uitgaven commissies die hen ondersteunen. (Tot twee terabyte aan data die op de server werden beschermd door rechten-instellingen.)

Een open map is gelabeld “Exxon-Mobile” [sic] en bevat werkbladen blijkbaar gebruikt om te voorspellen welke kiezers voor de olie en gas industrie. Verdeeld door de staat, de bestanden zijn kiezers namen en adressen, samen met een unieke RNC identificatie nummer voor elke AMERIKAANSE burger naar de stembus. Elke rij geeft aan waar de kiezers waarschijnlijk vallen over kwesties die van belang ExxonMobil, het land ‘ s grootste aardgasproducent.

De gegevens beoordeelt, bijvoorbeeld, of een bepaalde kiezer gelooft boren voor fossiele brandstoffen is van vitaal belang voor de veiligheid van de VS. Het voorspelt ook als de kiezer denkt dat de VS moet worden afgestapt van fossiele brandstoffen te gebruiken. De ExxonMobil “landelijke score” document bevat alleen gegevens op 182,746,897 Amerikanen verdeeld over 19 velden.

De “Exxon-Mobile” bestand bevat unieke RNC codes en het sentiment analyses voor meer dan 182 miljoen AMERIKAANSE kiezers. (UpGuard)

Reddit-analyse

Sommige van de gegevens die zijn opgenomen in de Diepe Wortel van de dataset bocht in ronduit bizarre grondgebied. Een map met de titel ‘reddit’ huizen 170 Gb data blijkbaar geschraapt van verschillende subreddits, waaronder de controversiële r/fatpeoplehate dat was de thuisbasis van een gemeenschap van mensen die geplaatst foto ‘ s van mensen, en bespotten hen voor hun gewicht vóór het verboden was Reddit platform in 2015. Andere subreddits die lijken te zijn geschraapt door Diepe Wortel of een partner organisatie die zich richt op de meer goedaardige onderwerpen, zoals mountainbiken en de spaanse taal.

De Reddit gegevens zou kunnen worden gebruikt als training data voor kunstmatige intelligentie algoritme gericht op de verwerking van natuurlijke taal, of wellicht is geoogst als onderdeel van een poging om de afstemming van Reddit gebruikers met hun kiezersregistratie records. Tijdens de verkiezingen van 2012 voor de cyclus, Barack Obama ‘ s campagne-data-team gebruikt op informatie uit Facebook profielen en profielen afgestemd om de kiezer records.

Tijdens de 2016 verkiezing seizoen, Reddit speelde gastheer voor een legioen van Trump supporters verzamelden zich in subreddits als r/The_Donald doorkambaar gelekt Democratische Nationale Comité van e-mails en craft pro-Trump memen. Trump zelf deel aan een “Ask Me Anything” sessie op r/The_Donald tijdens zijn campagne.

Gegeven hoe actief een aantal Trump supporters zijn op Reddit—r/The_Donald heeft momenteel meer dan 430.000 leden—is het logisch dat Trump ‘ s data team misschien wel geïnteresseerd in het analyseren van gegevens van de site.

Een FiveThirtyEight analyse, waarin gekeken waar r/The_Donald leden hun tijd doorbrengen als ze niet over politiek kan enig licht werpen op de reden waarom de Diepe Wortel verzameld r/fatpeoplehate gegevens. FiveThirtyEight gevonden dat, wanneer Redditors niet in een commentaar in r/The_Donald of andere politieke subreddits, zij het vaakst bezocht r/fatpeoplehate.

Het is mogelijk dat de Diepe Wortel bedoeling om de gegevens te gebruiken van r/fatpeoplehate om te bouwen aan een meer uitgebreide profiel van Trump kiezers. (Lundry weigerde commentaar te geven over zijn eerste verklaring op elk van de informatie opgenomen in de Diepe Wortel gegevensreeks.)

Een raw-uittreksel van de geschraapt Reddit gegevens die zijn opgeslagen op Diepe Root van de server. (UpGuard)

Echter, FiveThirtyEight het onderzoek houdt geen rekening met Diepe Wortel van de inzameling van de gegevens van mountainbiken en spaans-sprekende subreddits die waren niet zo populair bij de r/The_Donald leden—en van gegevens uit deze subreddits die het niet zo nauw met de Bazuin de diehard supporters misschien nuttiger zijn voor zijn campagne het doel van het nastreven van de twijfelende kiezers.

“Ik denk dat ze waren schrapen Reddit berichten te passen aan de kiezer bestand als een andere ingang voor individuele modellering,” een bron bekend met de campagne gegevens operaties vertelde Gizmodo. “Gezien het aantal willekeurige forums, mijn gok is ze begonnen met een lijst van de rekeningen te schrapen uit, liever dan het schrapen van alle forums en vervolgens proberen te komen van daar (in dat geval zou u beginnen met het politieke redenen).”

Bijpassende kiezer records met Reddit gebruikersnamen zou worden bemoeilijkt en een grootschalige inspanning zou waarschijnlijk resulteren in een veel onnauwkeurigheden, de bron zei. Echter, campagnes hebben getracht de wedstrijd kiezer bestanden met sociale media profielen in het verleden. Een dergelijke inspanning door Diepe Wortel zou niet geheel verrassend, en zou waarschijnlijk opbrengst rijke data op het kleine gedeelte van de gebruikers kon het de wedstrijd met hun kiezers profielen, de bron toegelicht.

Gegevens bloot gevoelige kiezer info

De Diepe Wortel incident is de grootste bekende lek van de Amerikanen’ kiezer records, overstijgt het verleden posities van een paar miljoen records. Vijf kiezer-bestand lekkage in de afgelopen 18 maanden blootgesteld tussen de 350.000 en 191 miljoen bestanden, sommige van die gekoppeld kiezer gegevens—naam, ras, geslacht, geboortedatum, adres, telefoonnummer, party band, enz.—met e-mail accounts, sociale media profielen en platen van wapenbezit.

“Ik kan me geen mogelijkheden voor het bestraffen van politieke data-inbreuken of anders op de juiste manier de prikkels.”

Campagnes en de data-analyse bedrijven ze in dienst zijn van een bijzonder zwak punt voor blootstelling van gegevens, security experts zeggen. Bedrijven die het niet goed beveiligen van gegevens van de klant kan worden geconfronteerd met grote financiële gevolgen, vraag het gewoon aan het Doel of Yahoo. Maar omdat de campagnes zijn korte termijn acties, is er niet veel stimulans voor hen om de beveiliging van gegevens serieus en waardevolle gegevens is vaak buiten te roesten na een verkiezing.

“Campagnes zijn zeer nauwkeurig is gericht. Ze zijn shoestring operaties, zelfs presidentiële campagnes. Zodat ze niet denken dat dit als een troef die ze nodig hebben te beschermen,” het Center for Democracy and Technology Hall vertelde Gizmodo.

Hoewel kiezer rollen zijn openbaar register en zijn gemakkelijk te bereiken—Ohio, bijvoorbeeld, maakt de kiezer rollen beschikbaar om te downloaden online—hun blootstelling kan nog steeds schadelijk.

De registratie van kiezers records zijn postcodes, geboortedata en andere persoonlijke gegevens die zijn cruciaal in het onderzoek inspanningen om opnieuw te identificeren anonieme medische gegevens. Latanya Sweeney, een professor van de overheid en technologie aan de Universiteit van Harvard, de beroemde gebruikt kiezer gegevens opnieuw te identificeren Massachusetts Gouverneur William Weld van informatie in anonieme ontslag uit het ziekenhuis records.

Vanwege de persoonlijke informatie die ze bevatten, de registratie van kiezers databases kunnen ook nuttig zijn bij diefstal van identiteit regelingen.

Hoewel de blootstelling van de Diepe Wortel van de gegevens heeft het potentieel om de schade van de kiezers, het is precies het soort gegevens dat campagnes lust en zal besteden miljoenen dollars te verkrijgen. Campagnes zijn gemotiveerd om te accumuleren zo veel diep persoonlijke informatie over kiezers mogelijk, zodat ze kunnen besteden hun advertentie-dollars in de juiste swing wijken waar ze waarschijnlijk te zwaaien het grootste aantal kiezers. Maar de kiezer gegevens snel gaat verlopen en campagnes close-up shop snel, zodat de gegevens wordt gezien als disposable en vaak niet goed beveiligd.

“Ik kan me geen mogelijkheden voor het bestraffen van politieke data-inbreuken of anders op de juiste manier de prikkels. Ik ben bang dat als er geen manier om te straffen campagnes voor het lekken van deze dingen, het zal blijven gebeuren totdat er iets ergs gebeurt,” aldus Hall. De gegevens die worden achtergelaten door campagnes vormen een slepende security probleem, voegde hij eraan toe. “Geen van die klootzakken waren ooit een Jongen of Meisje Scouts Scouts, ze niet pak uit wat ze pakken.”

[UpGuard]


Date:

by