GOP Données de l’Entreprise Accidentellement des Fuites de données Personnelles de Près de 200 Millions d’Électeurs Américains

Photo: Getty

Politique de données recueillies sur plus de 198 millions de citoyens AMÉRICAINS a été exposé ce mois-ci après une firme de marketing contractés par le Comité National Républicain stockés les documents internes sur un accessible au public Amazon serveur.

La fuite de données contient une mine de renseignements personnels sur environ 61 pour cent de la population américaine. Avec les adresses, les dates de naissance et numéros de téléphone, les dossiers comprennent des sentiment d’analyses utilisées par les groupes politiques afin de prédire où les électeurs individuels de l’automne chaud-bouton de questions telles que la possession d’armes, de la recherche sur les cellules souches, et le droit à l’avortement, ainsi que soupçonné d’appartenance religieuse et ethnique. Les données ont été amassées à partir d’une variété de sources—de l’interdit subreddit r/fatpeoplehate American Crossroads, le super PAC co-fondé par l’ancien de la Maison Blanche stratège de Karl Rove.

Racine profonde Analytics, un conservateur de données d’entreprise qui identifie les publics pour les annonces politiques, a confirmé la propriété des données Gizmodo vendredi.

UpGuard les cyber-risques analyste Chris Vickery découvert des Racines Profondes de données en ligne la semaine dernière. Plus d’un téraoctet de stockage sur le serveur de nuage sans la protection d’un mot de passe et peut être consulté par toute personne qui a trouvé l’URL. La plupart des fichiers ne sont pas d’origine à la Racine Profonde, mais sont plutôt l’ensemble de données de l’extérieur des entreprises et Républicain super PACs, faire la lumière sur le de plus en plus de données avancées écosystème qui a contribué à propulser le Président Donald Trump de faibles marges clés dans les swing states.

Bien que les fichiers possédés par des Racines Profondes qui serait normal dans une campagne, Républicain ou Démocratique, disent les experts de son exposition dans une seule base de données ouverte soulève d’importantes préoccupations en matière de confidentialité. “C’est précieux pour les personnes qui ont des fins malveillantes,” Joseph Lorenzo Hall, l’ingénieur en chef du Centre pour la Démocratie et la Technologie, a déclaré des données.

“C’est précieux pour les personnes qui ont des fins malveillantes.”

Le RNC porté une Racine de $983,000 l’année dernière, selon la Commission Électorale Fédérale des rapports, mais son serveur contenait des enregistrements à partir d’une variété d’autres conservateurs sources payés des millions d’autres, y compris Les Données Trust (aussi connu comme le GOP de Données de Confiance), le parti Républicain du primaire électeur fournisseur de fichier. Les données de Fiducie a reçu plus de 6,7 millions de dollars de la RNC pendant le cycle de 2016, selon les Ouvrir Secrets, et son président, Johnny DeStefano, sert aujourd’hui de Trump directeur de la présidentielle du personnel.

Les frères Koch politique des Américains pour la Prospérité, qui avait données-échange accord avec les Données de la Fiducie au cours de l’2016 cycle électoral, a contribué fortement à l’exposé des fichiers, comme l’a fait le marché firme de recherche TargetPoint, dont le co-fondateur précédemment servi comme directeur de Mitt Romney stratégie de l’équipe. (Financement des frères Koch a aussi conduit une entreprise de données connu comme i360, qui a commencé à échanger des électeurs fichiers avec les Données de la Confiance en 2014.) En outre, les fichiers fournis par le Déplacement de l’Américain Carrefour contenir stratégique de l’électeur de données utilisé pour objectif, entre autres, mécontents des Démocrates et undecideds dans le Nevada, New Hampshire, Ohio et d’autres champs de bataille unis.

Des Racines profondes en outre obtenu des centaines de fichiers (au moins) à partir Du Groupe Kantar, leader des médias et de la société d’étude de marché avec des bureaux à New York, Pékin, Moscou, et plus d’une centaine d’autres villes sur six continents. Chaque fichier offre une grande richesse de détails à propos de la publicité à caractère politique—estimé les coûts, l’auditoire de la démographie, de la portée et de la plus—par et sur des personnalités politiques et des groupes de la politique du spectre. Il y a des fichiers sur le Démocratique Sénatoriales du Comité de la Campagne, la planification familiale, et l’American Civil Liberties Union, ainsi que les fichiers à chaque candidat à la présidentielle de 2016, les Républicains inclus.

Qui plus est, Kantar des fichiers de chaque vidéo contiennent des liens vers des politiques annonces stockées sur Kantar les serveurs.

Kantar fichiers sur les annonces politiques impliquant des représentants des états-unis, les candidats et les organisations politiques. (UpGuard)

Les feuilles de calcul acquises à partir de TargetPoint, qui se sont associés avec des Racines Profondes et des GOP de Données de Confiance lors de l’élection de 2016, inclure les adresses, dates de naissance, et les affiliations politiques de près de 200 millions d’électeurs inscrits en 2008 et l’élection présidentielle de 2012, ainsi que quelques 2016 électeurs. TargetPoint de données vise à résoudre des questions sur où les électeurs se tenir debout sur des dizaines de questions politiques. Par exemple: Est-ce que l’électeur eco-friendly? – Ils favorisent la réduction des impôts? Croient-ils que les Démocrates doivent se lever pour l’emporter? Sont-ils d’accord avec Trump “l’Amérique d’Abord” point de vue économique? Les compagnies pharmaceutiques font beaucoup de dégâts: d’Accord ou pas d’accord?

Les détails des électeurs susceptibles de préférences pour des questions comme la recherche sur les cellules souches et le contrôle des armes à feu, ont vraisemblablement été dessinées à partir d’une variété de sources selon Démocratique stratège qui a parlé avec Gizmodo.

“Les données que cela serait une combinaison de données de sondage, les données du monde réel à partir de porte-frapper et téléphone de l’appelant et à d’autres activités de prospection, couplé avec la modélisation avec les données que nous possédons déjà pour extrapoler ce que les électeurs nous ne savons pas à propos de pense,” le stratège dit. “Les campagnes qui n’-il le droit de combiner toutes les données disponibles afin de prendre la plus robuste du modèle pour chaque votant dans l’univers cible.”

“Nous prenons l’entière responsabilité de cette situation.”

Dans une déclaration, la Racine Profonde fondateur Alex Lundry dit Gizmodo, “Nous prenons l’entière responsabilité de cette situation.” Il a dit que les données comprises propriétaire de l’information publiquement disponible électeur données fournies par l’etat fonctionnaires du gouvernement. “Depuis cet événement est venu à notre attention, nous avons mis à jour les paramètres d’accès et de mettre en place des protocoles pour prévenir de nouveaux accès à,” Lundry dit.

L’enracinement en profondeur des données a été exposé après la société a mis à jour ses paramètres de sécurité sur juin 1, Lundry dit. Racine profonde a conservé Stroz Friedberg, de la cybersécurité et de la criminalistique numérique ferme, pour enquêter. “Sur la base des informations que nous avons recueillies à ce jour, nous ne croyons pas que nos systèmes ont été piratés,” Lundry ajouté.

Jusqu’à présent, les Racines Profondes ne pas croire à ses propres données a été consulté par tout tiers malveillants pendant les 12 jours que les données ont été exposés sur le web ouvert.

Profondeur de la Racine du serveur a été découvert par UpGuard de Vickery, dans la nuit du 12 juin, comme il était à la recherche de données publiquement accessibles sur Amazon cloud service. Il a utilisé le même procédé le mois dernier à détecter les fichiers sensibles attaché à un Département AMÉRICAIN de la Défense projet et exposés par un employé d’une entreprise de défense.

Ce n’est pas la première fuite des électeurs fichiers découvert par Vickery, qui m’a dit de Gizmodo qu’il a été alarmé sur la façon dont les données ont été apparemment utilisé—certains états, par exemple, interdire l’utilisation commerciale des électeurs sur les listes d’enregistrements. En outre, il n’était pas immédiatement clair à qui les données ont appartenu. “Il a été décidé que l’application de la loi doit être contacté avant de tenter de tout contact avec l’entité responsable”, a déclaré Vickery, qui a rapporté que le serveur a été signé deux jours plus tard, le 14 juin.

Un web de données des entreprises de l’entonnoir de la recherche dans les campagnes

L’enracinement en profondeur des données met en lumière sur le de plus en plus sophistiqué des données de l’opération qui a nourri récente Républicain campagnes et met à nu le réseau complexe d’organisations politiques, de PACs et de l’analyse des entreprises que le commerce en vrac de données sur les électeurs. Dans un e-mail à Gizmodo, de Racines Profondes dit que ses électeurs modèles sont utilisés pour améliorer la compréhension de l’écoute de la TÉLÉVISION annonce politique acheteurs. “Les données obtenues n’a pas été construit pour ou utilisé par un client spécifique,” Lundry dit. “C’est notre propre analyse pour aider à informer les locaux de la télévision d’annonces d’achat.”

Cependant, la présence de données sur le serveur à partir de plusieurs organisations politiques, y compris TargetPoint de Données et de Confiance, suggère qu’il a été utilisé pour la politique Républicaine campagnes. Racines profondes et également travaille principalement avec des GOP de clients (bien que des vendeurs, tels que NationBuilder, le service, les Démocrates).

Racine profonde est l’une des trois entreprises embauché par le Comité National Républicain dans la course à l’élection présidentielle de 2016. Fondée par Lundry, de données scientifique sur la Jeb Bush et Mitt Romney campagnes, l’entreprise a été l’un des trois analytics équipes qui ont travaillé sur l’Atout de la campagne à la suite de la partie de la convention nationale, à l’été 2016.

Lundry du travail l’a amené en Atout de la campagne de la salle de guerre, selon un post-électorale AdAge selon l’article, qui retraçaient le GOP 2016 données efforts. Profondeur de la Racine a été cueillies à la main par le RNC alors chef d’état-major, Katie Walsh, en septembre de l’année dernière et s’est joint à deux autres données boutiques—TargetPoint la Consultation et la Digue de Solutions dans l’effort pour gagner Atout la présidence.

Walsh, qui travaille maintenant pour le but non lucratif de l’Amérique d’Abord Politiques après un bref passage à la Maison Blanche, a supervisé Trump données de l’opération en partenariat avec Brad Parscale, Trump directeur numérique. (Parscale n’a pas répondu à une demande de commenter avant la presse délai. Les tentatives de parvenir à Walsh pour les commentaires ont également échoué.) Walsh et Parscale concentré leurs efforts sur trois catégories d’électeurs, AdAge rapports: les électeurs qui pourraient être prédisposés à l’appui d’Atout, les électeurs Républicains qui étaient incertains de Trompette, et les électeurs qui ont été pencher en faveur d’Hillary Clinton, mais pourrait être convaincu par Trump message de changement de gouvernement, comme d’habitude.

Une feuille de calcul de prévision spécifiques des électeurs susceptibles d’opinions sur diverses questions pesé à l’aide d’un 0 à 1 de l’échelle. (UpGuard)

D’appel pour les trois grands catégories, il apparaît que l’Atout de l’équipe s’est inspirée des électeurs, les données fournies par les Données de la Confiance. Remplir des listes électorales pour l’année 2008 et 2012, ainsi que partiel à 2016 les listes électorales de la Floride et l’Ohio, apparemment compilé les Données de Fiducie sont contenus dans le jeu de données exposées par de Profondes Racines.

Les données de la Fiducie acquiert les listes électorales de représentants de l’état, puis de normaliser les données sur les électeurs pour créer un nettoyage faciles à gérer, enregistrer toutes les NOUS les électeurs, une source familière avec les opérations de la firme dit Gizmodo. De données sur les électeurs lui-même est rendu public et n’est donc pas particulièrement sensible, la source ajoutée, mais les Données des outils de Fiducie utilise pour normaliser les données sont considérés comme propriétaires. Les données ont ensuite été transmis aux clients politiques, y compris les sociétés d’analytics de Profondes Racines. Bien que les Données de Fiducie exige de ses clients de protéger les données, il doit prendre des clients à leur parole que le cryptage standard de l’industrie et des protocoles de sécurité sont en place.

TargetPoint et de la Chaussée, les deux entreprises employée par le RNC en plus Profondes, apparemment couches de leur propre analytics au sommet de l’information fournie par les Données de la Confiance. TargetPoint mené des milliers de sondages par semaine dans 22 états, selon l’AdAge, jaugeage des électeurs le sentiment sur une variété de sujets. Tandis que la Chaussée a aidé à gérer les données, de Racines Profondes utilisé pour la perfectionner sa publicité à la TÉLÉVISION objectifs—produire des taux de participation électorale des estimations par comté et par l’aide que l’intelligence de cibler ses annonces achète.

Une source avec des années d’expérience de travail sur les politiques de campagne des opérations de données, dit Gizmodo que les données exposées par de Profondes Racines semblait être personnalisés pour le RNC et avait apparemment été utilisé pour créer des modèles de participation des électeurs et de préférences. Les métadonnées dans les fichiers suggéré que la base de données n’a pas de Racines Profondes de la copie de travail, mais plutôt un post-électorale version de ses données, a dit la source, ajoutant que c’était un peu surprenant que les fichiers n’avaient pas été mis au rebut.

Parce que les données de 2008 et les élections de 2012 est dépassée—la source par rapport à la nature de l’adresse et le numéro de téléphone que l’on pouvait retrouver sur un “internet moche de recherche du site”—ce n’est pas très utile. Même l’2016 données devient rapidement obsolète. “C’est une propriété dataset sur la base d’un mélange des registres publics, des données auprès de fournisseurs commerciaux, et une variété de modèles prédictifs de provenance incertaine et de la qualité,” a dit la source, ajoutant: “sans doute il a fallu des millions de dollars à produire.”

Bien que la base d’information de l’électeur est rendu public, la Racine Profonde de l’ensemble de données contient un tourbillon d’informations confidentielles de la RNC de données d’entreprises. Beaucoup de noms de fichiers indiquent qu’ils contiennent potentiellement des études de marché sur les candidats démocrates et indépendants des dépenses des comités de soutien. (Jusqu’à deux téraoctets de données contenues sur le serveur ont été protégés par les paramètres d’autorisation.)

Un exposé dossier est intitulé “Exxon-Mobile” et contient des feuilles de calcul apparemment utilisé pour prédire les électeurs de soutien de l’industrie pétrolière et gazière. Divisé par l’état, les fichiers sont les électeurs les noms et adresses, le long avec un unique RNC numéro d’identification attribué à chaque citoyen AMÉRICAIN inscrits pour voter. Chaque ligne indique où les électeurs susceptibles de tomber sur des questions d’intérêt pour Exxon-Mobile, le plus grand producteur de gaz naturel.

Les données évalue, par exemple, de savoir si ou non un électeur croit de forage pour les combustibles fossiles est essentiel à la sécurité. Il prédit aussi si l’électeur pense que les etats-unis devraient s’éloigner de combustibles fossiles utiliser. L’Exxon-Mobile national “score” seul document contient des données sur 182,746,897 Américains répartis sur 19 champs.

L ‘ “Exxon-Mobile” fichier contient un unique RNC codes et le sentiment d’analyses pour plus de 182 millions de dollars US électeurs. (UpGuard)

Reddit analyse

Certaines des données contenues dans les Racines Profondes du dataset vire en carrément bizarre territoire. Un dossier intitulé tout simplement “reddit” maisons 170 go de données apparemment gratté de plusieurs subreddits, y compris le très controversé r/fatpeoplehate qui était à la maison à une communauté de personnes qui ont posté des photos de personnes et se moqua d’eux pour leur poids avant il était interdit de Reddit de la plate-forme en 2015. D’autres subreddits qui semblent avoir été gratté par de Profondes Racines ou une partenaire organisation axée sur la plus bénigne des sujets, comme le vtt et la langue espagnole.

Le Reddit de données pourraient avoir été utilisées comme données d’apprentissage pour une intelligence artificielle algorithme concentrée sur le traitement du langage naturel, ou il peut avoir été récoltées dans le cadre d’un effort pour correspondre Reddit utilisateurs avec leurs dossiers d’inscription des électeurs. Lors de l’élection de 2012 cycle, la campagne de Barack Obama de données de l’équipe fondée sur des informations glanées à partir de Facebook profils et correspondait à des profils d’électeur enregistrements.

Lors de l’élection de 2016 saison, Reddit a été l’hôte d’une légion d’Atout supporters qui se sont réunis à subreddits comme r/The_Donald de passer au peigne fin fuite Comité National Démocrate e-mails et de l’artisanat pro-Trump mèmes. Trump lui-même participé à une “Demandez-Moi n’importe Quoi” session sur r/The_Donald au cours de sa campagne.

Compte tenu de l’activité de certains Trump supporters sont sur Reddit—r/The_Donald compte actuellement plus de 430 000 membres—il est logique que l’Atout de données de l’équipe pourraient être intéressés à l’analyse des données à partir du site.

Un FiveThirtyEight analyse regardé où r/The_Donald membres passent leur temps quand ils ne parlent pas de la politique pourrait faire la lumière sur pourquoi les Racines Profondes recueillies r/fatpeoplehate de données. FiveThirtyEight constaté que, lorsque les Redditors n’étaient pas de commentaire dans la r/The_Donald ou d’autres subreddits, elles sont le plus souvent fréquentés r/fatpeoplehate.

Il est possible que la Racine Profonde de l’intention d’utiliser les données de r/fatpeoplehate de construire un profil plus complet de la Trump électeurs. (Lundry a refusé de commenter au-delà de sa première déclaration sur l’un quelconque des renseignements inclus dans les Racines Profondes jeu de données.)

Un brut extrait de la raclée Reddit données stockées sur la Profondeur de la Racine du serveur. (UpGuard)

Cependant, FiveThirtyEight de l’enquête ne tient pas compte de l’enracinement en Profondeur de la collecte de données à partir de vtt et de langue espagnole subreddits qui n’étaient pas aussi populaires avec r/The_Donald membres—et les données de ces subreddits qui ne sont pas si étroitement liée à la Trump irréductibles supporters pourrait être plus utile pour sa campagne dont l’objectif est de poursuivre swing électeurs.

“J’imagine qu’ils ont été grattage Reddit postes de match pour le dossier de l’électeur comme une autre entrée pour chaque modélisation,” une source familière avec les données de campagne opérations dit Gizmodo. “Vu le nombre de forums au hasard, je suppose qu’ils ont commencé avec une liste de comptes à gratter, plutôt que de grattage de tous les forums alors d’essayer de faire correspondre, à partir de là (dans ce cas, vous auriez du commencer avec le politique).”

L’appariement des électeurs dossiers avec les noms d’utilisateur Reddit serait compliqué et tout effort serait susceptible d’entraîner de nombreuses inexactitudes, a dit la source. Cependant, les campagnes ont tenté de faire correspondre les électeurs des fichiers avec vos profils de médias sociaux dans le passé. Un tel effort par de Profondes Racines ne serait pas totalement surprenant, et serait susceptible de générer de précieuses données sur la petite partie des utilisateurs, il a été en mesure de correspondre avec leurs profils d’électeurs, la source a expliqué.

Les données expose sensibles électeur info

La Racine Profonde de l’incident représente la plus connue de la fuite des Américains’ électeur dossiers, devançant les expositions passées par plusieurs millions de documents. Cinq électeurs-fichier fuites au cours des 18 derniers mois, exposés entre 350 000 et 191 millions de fichiers, dont certains jumelé de données sur les électeurs de nom, de race, de sexe, date de naissance, adresse, numéro de téléphone, l’appartenance à un parti, etc.—avec les comptes de messagerie, profils de médias sociaux, et les registres de détention d’armes.

“Je ne peux penser à aucun avenues pour punir les politiques, les violations de données ou autrement aligner correctement les mesures incitatives”.

Les campagnes et les firmes d’analyse de données qu’ils emploient sont particulièrement faible point pour les données d’exposition, les experts en sécurité disent. Les sociétés qui ne fixent pas correctement les données du client peuvent faire face à d’importantes répercussions financières—il suffit de demander Cible ou Yahoo. Mais parce que les campagnes sont les opérations à court terme, il n’y a pas beaucoup d’intérêt pour eux de prendre de données de sécurité très au sérieux, et les données de valeur est souvent laissé de côté à la rouille, après une élection.

“Les campagnes sont très ciblées. Ils sont très restreints opérations, même les campagnes présidentielles. Afin de ne pas considérer cela comme un atout dont ils ont besoin pour protéger les,” le Centre pour la Démocratie et la Technologie de la Salle du dit Gizmodo.

Même si les listes électorales sont versés au dossier public et facile d’accès—Ohio, par exemple, fait ses listes électorales disponible pour le téléchargement en ligne—leur exposition peut encore être dangereux.

Dossiers d’inscription des électeurs comprennent les codes postaux, la date de naissance et d’autres renseignements personnels qui ont été crucial dans les efforts de recherche visant à identifier les anonymes, les données médicales. Latanya Sweeney, un professeur de gouvernement et de la technologie à l’Université de Harvard, a utilisé de données sur les électeurs de se ré-identifier le Gouverneur du Massachusetts, William Weld de l’information anonyme, la sortie de l’hôpital les dossiers.

Parce que des renseignements personnels qu’ils contiennent, de l’inscription des électeurs bases de données peuvent également être utiles dans le vol d’identité régimes.

Même si l’exposition de la Racine Profonde de données a le potentiel de nuire les électeurs, c’est exactement le genre de données que les campagnes de convoiter et dépenser des millions de dollars pour obtenir. Les campagnes sont motivés pour accumuler autant d’profondément renseignements personnels à propos des électeurs que possible, afin qu’ils puissent passer leurs annonces de dollars dans le droit swing quartiers où ils sont susceptibles d’influencer le plus grand nombre d’électeurs. Mais les données sur les électeurs va rapidement obsolètes et des campagnes de fermer le magasin rapidement, donc les données sont considérés comme jetables et souvent n’est pas bien protégé.

“Je ne peux penser à aucun avenues pour punir les politiques, les violations de données ou autrement aligner correctement les incitations. J’ai peur que si il n’y a aucun moyen de les punir campagnes de fuite de ce genre de choses, il va continuer à se produire jusqu’à ce que quelque chose de mauvais,” a dit Hall. Les données laissées par les campagnes peuvent poser planer un problème de sécurité, at-il ajouté. “Aucun de ces enculés ont jamais été des Scouts de Garçon ou de jeune Fille Scouts, ils n’emballez pas ce qu’ils pack”.

[UpGuard]


Date:

by