GOP Dati Azienda Accidentalmente Perdite di dati Personali di Quasi 200 Milioni di Elettori Americani

Foto: Getty

Politiche di dati raccolti su più di 198 milioni di NOI cittadini è stato esposto questo mese dopo un marketing azienda incaricata dal Comitato Nazionale Repubblicano memorizzati i documenti interni su un sito pubblicamente accessibili server di Amazon.

La perdita di dati contiene una ricchezza di informazioni personali su circa il 61 per cento della popolazione degli stati UNITI. Insieme con indirizzi, date di nascita, numeri di telefono, i record avanzate analisi di sentiment utilizzato da gruppi politici di prevedere dove i singoli elettori caduta sul caldo, pulsante, questioni come il possesso di armi, la ricerca sulle cellule staminali, e il diritto all’aborto, così come sospetta appartenenza religiosa ed etnica. I dati è stato raccolto da una varietà di fonti—dal bandito subreddit r/fatpeoplehate American Crossroads, il super PAC co-fondata da ex Casa Bianca stratega Karl Rove.

Radice profonda Analytics, un conservatore dati azienda che identifica il pubblico per gli annunci politici, ha confermato la proprietà dei dati a Gizmodo, il venerdì.

UpGuard rischio informatico analista Chris Vickery scoperto Radice Profonda dati online della scorsa settimana. Più di un terabyte è salvato sul cloud server senza la protezione di una password e può essere letta da chiunque trovato l’URL. Molti dei file che non hanno origine a Radice Profonda, ma sono, invece, l’aggregazione di dati al di fuori delle imprese e Repubblicano super PACs, gettando luce sulla sempre più avanzate, dati di ecosistema che hanno contribuito a spingere il Presidente Donald Trump slim margini in chiave swing states.

Anche se i file posseduto da una Profonda Radice sarebbe tipica in qualsiasi campagna, Repubblicano o Democratico, gli esperti dicono che la sua esposizione in un unico open database solleva importanti problemi di privacy. “Questo è utile per le persone che hanno scopi nefandi,” Giuseppe Lorenzo Sala, chief technologist presso il Centro per la Democrazia e la Tecnologia, ha commentato i dati.

“Questo è utile per le persone che hanno scopi nefandi.”

La RNC pagato Radice Profonda $983,000 lo scorso anno, secondo la Commissione Elettorale Federale, i rapporti, ma il suo server contenute record da una varietà di altri conservatori fonti pagato milioni di persone, compresi I Dati di Fiducia (anche noto come GOP Dati di Fiducia), il partito Repubblicano primario di un elettore del provider di file. I dati di Fiducia ricevuto più di $6,7 milioni di euro dalla RNC durante il 2016 ciclo, secondo Aprire Segreti, e il suo presidente, Johnny DeStefano, ora serve come Trump, direttore del dpr personale.

I fratelli Koch’ gruppo politico gli Americani per la Prosperità, che ha avuto un lo scambio dei dati l’accordo con i Dati di Fiducia durante il 2016 ciclo elettorale, ha contribuito pesantemente esposto file, come ha fatto la società di ricerche di mercato TargetPoint, il cui co-fondatore precedentemente servito come direttore di Mitt Romney di strategia di squadra. (Finanziamento dai fratelli Koch ha una data società i360, che iniziano a scambiarsi elettore file con i Dati di Fiducia nel 2014.) Inoltre, i file forniti dal Rove American Crossroads contenere strategico elettore dati utilizzati per l’obiettivo, tra gli altri, delusi Democratici e undecideds in Nevada, New Hampshire, Ohio e degli altri principali stati campo di battaglia.

Radice profonda ulteriori ottenuto centinaia di file (almeno) da Kantar Group, una delle principali media e società di ricerche di mercato con sede a New York, Pechino, Mosca, e più di un centinaio di altre città in sei continenti. Ogni file ricco di dettagli circa la politica degli annunci—costo stimato del pubblico, la demografia, la portata, e di più, e su personaggi politici e dei gruppi di spettro politico. Ci sono dei file sul Democratica Senatorio un Comitato elettorale, Planned Parenthood, e l’American Civil Liberties Union, così come i file su ogni candidato presidenziale 2016, i Repubblicani incluso.

Cosa c’è di più, la Kantar file contengono link a video correlati gli annunci politici memorizzati su Kantar server.

Kantar file su politica annunci di coinvolgere i funzionari, i candidati e le organizzazioni politiche. (UpGuard)

Fogli di calcolo acquisiti da TargetPoint, che ha stretto una collaborazione con la Radice Profonda e GOP Dati Trust nel 2016 elezione, la home indirizzi, date di nascita, e la festa di affiliazioni di quasi 200 milioni di elettori del 2008 e alle elezioni presidenziali del 2012, così come alcune 2016 elettori. TargetPoint dati cerca di risolvere le questioni su cui i singoli elettori stare su decine di questioni politiche. Per esempio: l’elettore eco-friendly? Essi favoriscono l’abbassamento delle tasse? Sono convinti che i Democratici dovrebbero stare fino a Briscola? Non sono d’accordo con Trump “America First” posizione economica? Le aziende farmaceutiche di fare grandi danni: si è d’Accordo o in Disaccordo?

I dettagli degli elettori, e’ probabile che le preferenze per questioni come la ricerca sulle cellule staminali e sul controllo delle armi erano probabilmente tratte da una varietà di fonti secondo un Democratico stratega che ha parlato con Gizmodo.

“I dati come che sarebbe una combinazione di polling dei dati, dati del mondo reale da porta bussare e telefoniche e di altre attività di prospezione, accoppiato con la modellazione utilizzando i dati già abbiamo a estrapolare ciò che gli elettori non sappiamo potrebbe pensare,” la stratega, ha detto. “Le campagne che fanno bene combinare tutti i dati disponibili, insieme per rendere più robusto modello per ogni singolo elettore nella destinazione universo.”

“Ci assumiamo la piena responsabilità per questa situazione.”

In una dichiarazione, la Radice Profonda fondatore Alex Lundry detto Gizmodo, “Ci assumiamo la piena responsabilità per questa situazione.” Ha detto che i dati inclusi proprietario di informazioni pubblicamente disponibili dati elettorali previste dallo stato per i funzionari di governo. “Dal momento che questo evento è giunto alla nostra attenzione, abbiamo aggiornato le impostazioni di accesso e di mettere in atto di protocolli per prevenire un ulteriore accesso,” Lundry detto.

Radice profonda di dati è stato esposto dopo che la società ha aggiornato il suo impostazioni di sicurezza, il 1 ° giugno, Lundry detto. Radice profonda ha mantenuto Stroz Friedberg, la sicurezza informatica e digital forensics impresa, per indagare. “In base alle informazioni che abbiamo raccolto finora, non crediamo che i nostri sistemi sono stati violati,” Lundry aggiunto.

Finora, le radici Profonde non crede che il suo proprietario dei dati è stata letta da eventuali malintenzionati durante i 12 giorni che i dati esposti sul web aperto.

Radice profonda del server è stato scoperto da UpGuard del Vickery la notte del 12 giugno, mentre stava cercando di dati pubblicamente accessibili sul cloud di Amazon di servizio. Ha usato lo stesso processo lo scorso mese di rilevare i file sensibili legati alla Difesa degli stati UNITI Dipartimento di progetto e di esposti da parte di un dipendente di un top della difesa.

Questa non è la prima perdita di elettore file scoperto da Vickery, che ha detto Gizmodo che era preoccupato più di come i dati è stato a quanto pare—alcuni stati, per esempio, vietare l’uso commerciale di elettore record. Inoltre, non era immediatamente chiaro ai quali i dati apparteneva. “È stato deciso che l’applicazione della legge dovrebbe essere contattati prima di tentare qualsiasi contatto con il soggetto responsabile”, ha detto Vickery, che ha riferito che il server è stato fissato due giorni dopo, il 14 giugno.

Un web di dati imprese imbuto di ricerca in campagne

Radice profonda dei dati mette in luce sul sempre più sofisticate data operazione che ha alimentato il recente Repubblicano campagne e mette a nudo l’intricata rete di organizzazioni politiche, i PACs e le società di analisi che il commercio di massa dati elettorali. In una e-mail a Gizmodo, Radice Profonda è detto che i suoi elettori sono i modelli utilizzati per migliorare la comprensione della TV di audience per la politica degli annunci acquirenti. “L’accesso ai dati non è stato costruito o utilizzato da qualsiasi client specifico,” Lundry detto. “Non è di nostra proprietà che di analisi per aiutare a informare la televisione locale acquisto di annunci.”

Tuttavia, la presenza di dati sul server da diverse organizzazioni politiche, tra cui TargetPoint e i Dati di Fiducia, suggerisce che è stato utilizzato per il Repubblicano campagne politiche. Radice profonda, inoltre, lavora principalmente con il MOL clienti (anche se simile fornitori, come NationBuilder, servizio Democratici).

Radice profonda è uno dei tre dati di aziende assunti dal Comitato Nazionale Repubblicano in corsa per le elezioni presidenziali del 2016. Fondata da Lundry, un data scientist sul Jeb Bush e Mitt Romney campagne, l’azienda è stata una delle tre analytics team che ha lavorato al Trump campagna del partito, convention nazionale nell’estate del 2016.

Lundry lavoro lo ha portato in Trump campagna di guerra, secondo un post-elettorale Adagio articolo che cambiò il GOP 2016 dati sforzi. Radice profonda è stato raccolto a mano da RNC, e poi il capo del personale, Katie Walsh, nel settembre dello scorso anno e si unirono altri due dati negozi—TargetPoint Consulenza e Causeway Soluzioni—nel tentativo di vincere Trump presidenza.

Walsh, che ora lavora per il no-profit America in Primo luogo Politiche, dopo una breve esperienza alla Casa Bianca, ha curato Trump dati dell’operazione in partnership con Brad Parscale, Trump, digital director. (Parscale non ha risposto a una richiesta di commento prima di premere. I tentativi di raggiungere Walsh per il commento sono anche riuscito.) Walsh e Parscale concentrato i loro sforzi su tre categorie di elettori, Adagio report: gli elettori, che potrebbero essere predisposti a supporto Trump, gli elettori Repubblicani che erano incerti circa la Tromba, e gli elettori che sono sporgendosi verso di Hillary Clinton, ma potrebbe essere convinto da Trump messaggio di modifica del governo-come-al-solito.

Un foglio di calcolo di previsione specifica degli elettori probabilmente opinioni su varie questioni pesato con un 0-a-1 in scala. (UpGuard)

Un appello per i tre cruciale categorie, sembra che Trump team invocata elettore dati forniti dalla Data di Fiducia. Completa elettore rotoli per il 2008 e il 2012, come pure parziale 2016 elettore rotoli per la Florida e l’Ohio, a quanto pare compilato con i Dati di Fiducia sono contenuti nel dataset esposti da Radice Profonda.

Dati acquisisce Fiducia degli elettori rotoli da funzionari di stato e quindi standardizza i dati elettorali a creare un ambiente pulito, gestibile record di tutti gli utenti registrati di NOI elettori, una fonte familiarità con le attività dell’azienda ha detto Gizmodo. Dati elettorali stesso è il record di pubblico e, pertanto, non è particolarmente sensibile, ha aggiunto la fonte, ma i Dati di strumenti di Fiducia utilizza per standardizzare i dati sono considerati di proprietà. I dati vengono quindi forniti di politiche di clienti, tra cui analytics aziende come Radice Profonda. Mentre i Dati Fiducia richiede ai propri clienti a proteggere i dati, si deve prendere i clienti al loro parola, e che la crittografia standard e protocolli di sicurezza sono a posto.

TargetPoint e Causeway, le due imprese incaricate da RNC oltre a Radice Profonda, a quanto pare a strati propria analytics in cima le informazioni fornite dai Dati di Fiducia. TargetPoint condotto migliaia di sondaggi a settimana in 22 stati, secondo l’Adagio, la misurazione degli elettori sentimento su una varietà di argomenti. Mentre Causeway aiutato a gestire i dati, Radice Profonda usato per perfezionare la sua pubblicità televisiva obiettivi—la produzione di affluenza alle urne stime di contea e di utilizzare l’intelligenza per target di annunci compra.

Una fonte con anni di esperienza di lavoro in campagna elettorale le operazioni di dati ha detto Gizmodo che i dati esposti da Radice Profonda sembrava essere personalizzate per l’RNC e a quanto pare era stato utilizzato per creare modelli per la partecipazione e preferenze degli elettori. I metadati nel file suggerito che il database non era la Radice Profonda della copia di lavoro, ma piuttosto un post-elettorale versione dei suoi dati, ha detto la fonte, aggiungendo che non era sorprendente che il file non era stato scartato.

Poiché i dati del 2008 e del 2012 elezioni è obsoleto, sorgente rispetto al tipo di indirizzo e dei dati del telefono si potrebbe trovare su un “pessimo internet di ricerca di un sito”—non è molto prezioso. Anche il 2016 dati è rapidamente diventando obsolete. “Questo è un proprietario di set di dati basato su un mix di pubblici registri, dati dal provider di servizi commerciali, e una varietà di modelli predittivi di dubbia provenienza e qualità,” ha detto la fonte, aggiungendo: “senza dubbio ci sono voluti milioni di dollari per produrre.”

Anche se di base votante informazioni record di pubblico, la Radice Profonda del set di dati contiene un turbinio di informazioni riservate da RNC dati di aziende. Molti dei nomi indicano che potenzialmente contengono la ricerca di mercato sui candidati Democratici e indipendenti spesa comitati che li supportano. (Fino a due terabyte di dati contenuti sul server sono protetti da impostazioni di autorizzazione.)

Quella esposta cartella denominata “Exxon-Mobile” e contiene fogli di calcolo apparentemente utilizzato per prevedere che gli elettori sostenere l’industria petrolifera e del gas. Divisi per stato, i file sono elettori i nomi e gli indirizzi, insieme con un unico RNC numero di identificazione assegnato per ogni cittadino iscritto nelle liste elettorali. Ogni riga indica il punto in cui gli elettori probabilmente caduta su tematiche di interesse Exxon-Mobile, il più grande del paese produttore di gas naturale.

La data valuta, per esempio, se una specifica votanti ritiene che per l’estrazione di combustibili fossili è di vitale importanza per la sicurezza degli stati UNITI. Inoltre, prevede che se l’elettore pensa che gli stati UNITI devono allontanarsi dall’utilizzo dei combustibili fossili. La Exxon-Mobile “segno nazionale” documento di per sé contiene i dati sui 182,746,897 Americani diffusione in tutto 19 i campi.

“Exxon-Mobile” file contiene unico RNC codici e analisi di sentiment per oltre 182 milioni di elettori. (UpGuard)

Reddit analisi

Alcuni dei dati contenuti nella Radice Profonda del set di dati vira in decisamente bizzarro territorio. Una cartella intitolata semplicemente ‘reddit case 170 Giga di dati apparentemente raschiato da diversi subreddits, tra cui il controverso r/fatpeoplehate che fu sede di una comunità di persone che hanno pubblicato le immagini di persone e derisi per il loro peso prima che è stato bannato da Reddit piattaforma nel 2015. Altri subreddits, che sembrano essere stati raschiati dalla Radice Profonda o un’organizzazione partner concentrata su più benigna argomenti, come la mountain bike e la lingua spagnola.

Il Reddit dati potrebbe essere stato usato come dati di training per un algoritmo di intelligenza artificiale focalizzata sull’elaborazione del linguaggio naturale, o forse sono state raccolte come parte di uno sforzo per abbinare Reddit gli utenti con i loro elettori record di registrazione. Durante il 2012 ciclo elettorale, Barack Obama, team di dati si basavano su informazioni raccolte da Facebook e profili abbinati profili degli elettori record.

Durante il 2016 elezione stagione, Reddit ha ospitato una legione di Briscola sostenitori che si sono riuniti a subreddits come r/The_Donald al pettine attraverso trapelato Comitato Nazionale Democratico e-mail e artigianali pro-Trump memi. Trump si è partecipato a un “Ask Me Anything” sessione r/The_Donald durante la sua campagna.

Dato come alcuni Trump sostenitori sono su Reddit—r/The_Donald attualmente vanta più di 430.000 membri—ha senso che Trump team di dati potrebbero essere interessati ad analizzare i dati dal sito.

Un FiveThirtyEight analisi che visto dove r/The_Donald membri trascorrere il loro tempo quando non stai parlando di politica potrebbe far luce sul perché Radice Profonda raccolti r/fatpeoplehate dati. FiveThirtyEight trovato che, quando gli utenti reddit non erano di commentare in r/The_Donald o altri politici subreddits, che più spesso frequentato r/fatpeoplehate.

È possibile che la Radice Profonda intende utilizzare i dati r/fatpeoplehate per la costruzione di un profilo completo di Briscola elettori. (Lundry ha rifiutato di commentare oltre la sua dichiarazione iniziale su una qualsiasi delle informazioni contenute nella Radice Profonda del set di dati.)

Un raw estratto della raschiato Reddit i dati memorizzati sulla Radice Profonda del server. (UpGuard)

Tuttavia, FiveThirtyEight di indagine non tiene conto Radice Profonda della raccolta di dati da mountain-bike e di lingua spagnola subreddits che non erano così popolari con r/The_Donald membri di dati e da questi subreddits che non sono così strettamente legata alla Trump irriducibili sostenitori potrebbe essere più utile per la sua campagna elettorale l’obiettivo di perseguire swing elettori.

“La mia ipotesi è che si trattasse di raschiare Reddit post partita all’elettore file come un altro ingresso per i singoli modellazione,” una fonte vicina ai dati della campagna operazioni di detto Gizmodo. “Dato il numero di casuale forum, la mia ipotesi è che ha iniziato con un elenco di account per raschiare, piuttosto che raschiando da tutti i forum e poi cercando di partita da lì (nel qual caso è necessario iniziare con i politici.”

Corrispondenza degli elettori record con nomi utente Reddit sarebbe complicato e qualsiasi sforzo su grande scala, possono provocare molte inesattezze, ha detto la fonte. Tuttavia, le campagne hanno tentato per corrispondenza degli elettori file con profili di social media in passato. Tale sforzo da radici Profonde non sarebbe del tutto sorprendente, e sarebbe probabilmente resa ricca di dati sulla piccola parte di utenti è stato in grado di corrispondere con i loro elettori profili, la fonte ha spiegato.

Dati espone sensibili elettore info

La Radice Profonda incidente rappresenta il più grande conosciuto perdita di Americani’ elettore record, superando esposizioni passate da diversi milioni di record. Cinque elettore-file perdite negli ultimi 18 mesi, esposto tra i 350.000 e i 191 milioni di file, alcuni dei quali associati elettore dati—nome, razza, sesso, data di nascita, indirizzo, numero di telefono, il partito di appartenenza, etc.—con account di posta elettronica, profili di social media, e il record di possesso di armi.

“Non riesco a pensare a strade per punire i politici violazioni di dati o altrimenti un corretto allineamento degli incentivi.”

Le campagne e le società di analisi dei dati si avvale di un particolare punto debole per l’esposizione di dati, gli esperti di sicurezza dicono. Le società che non proteggere adeguatamente i dati del cliente possono incontrare notevoli ripercussioni finanziarie—basta chiedere a Destinazione o Yahoo. Ma perché le campagne sono le operazioni a breve, c’è poco incentivo per loro di prendere serio la protezione dei dati, e dati preziosi, è spesso lasciato fuori la ruggine, dopo le elezioni.

“Le campagne sono molto circoscritta. Sono soldi di operazioni, anche le campagne presidenziali. Quindi non pensare a questo come un bene da proteggere”, il Centro per la Democrazia e la Tecnologia s Hall detto Gizmodo.

Anche se votante rotoli sono record di pubblico e sono di facile accesso—Ohio, per esempio, fa il suo elettore rotoli disponibile per il download online—loro esposizione può ancora essere dannoso.

La registrazione degli elettori documentazione comprende i codici di avviamento postale, data di nascita e altre informazioni personali che hanno avuto un ruolo fondamentale nella ricerca gli sforzi per identificare anonimo dati medici. Nei presso del latanya Sweeney, un professore di governo e tecnologia presso l’Università di Harvard, notoriamente utilizzato dati elettorali a re-identificare il Governatore del Massachusetts William Weld da informazioni in forma anonima di dimissione ospedaliera.

A causa dei dati personali in essi contenuti, la registrazione degli elettori database può essere utile anche per il furto di identità schemi.

Anche se l’esposizione della Radice Profonda di dati ha il potenziale per danneggiare gli elettori, è esattamente il tipo di dati che le campagne di desiderarla, e si spendono milioni di dollari per ottenere. Le campagne sono motivati ad accumulare tanto profondamente informazioni personali su di elettori possibile, in modo che possano trascorrere il loro annuncio di dollari in il diritto swing distretti in cui sono suscettibili di influenzare il maggior numero di voti. Ma dati elettorali rapidamente lievitato e campagne di chiudere bottega rapidamente, in modo che i dati è visto come usa e getta e spesso non è ben protetto.

“Non riesco a pensare a strade per punire i politici violazioni di dati o altrimenti un corretto allineamento degli incentivi. Ho paura che se non c’è un modo per punire campagne di perdite di questa roba, continuerà ad accadere fino a quando succede qualcosa di brutto, Hall ha detto. I dati lasciati da campagne possono rappresentare un persistente problema di sicurezza, ha aggiunto. “Nessuno di questi figli di puttana sono mai stati Esploratori di Ragazzo o Ragazza Scout, non pack che hanno pack”.

[UpGuard]


Date:

by