Anvendes machine learning teknikker, der kan identificere diskanter’ adfærd i realtid, og find dem til inden for 100 meter, ifølge et papir
Rochester University dataloger, der blev offentliggjort tidligere i denne måned.
Forskerholdet fokuseret på at opdage mønstre for brug af alkohol i byer og forstæder indstillinger til bedre at forstå, hvor og hvordan folk drikker. Drikke resultater i omkring 75.000 dødsfald årligt i Usa, og de oplysninger, der kan bruges i den offentlige sundheds-indsats.
“De mere interessante oplysninger, der kan udledes af denne undersøgelse er ikke den position tracking, men den personlighed forbindelser mellem dem, at post ofte og deres drikkevaner,” sagde Jim McGregor, ledende analytiker hos
Tirias Forskning.
“Den potentielle information, der kan udledes, er næsten endeløs, afhængigt af hvem der kigger på den data, og hvad de leder efter,” fortalte han TechNewsWorld.
Den teknik, der “kunne være et nyttigt værktøj til analyse af data til direct marketing -, trafik mønstre, … eller det kan bruges af politiet til at spore potentielle spritbilister, af kriminelle til at spore, når folk er væk fra deres hjem, eller af forsikringsselskaber til at spore de usunde vaner for kunderne,” McGregor tilføjet.
Hvordan Forskerne Gjorde Det
Holdet har indsamlet, der er geotagget tweets fra byer, forstæder og landdistrikter områder af New York state fra juli 2013 til juli 2014, preprocessed dem for at gøre dem lettere at analysere, og derefter brugte Amazons Mechanical Turk til at skabe en uddannelse, der fanger detaljer som om de tweets, der er nævnt drikke alkohol, de bruger det at drikke eller af brugeren med at drikke, når tweeting.
Den fremgangsmåde, der følges til begrebet menneskelige guidet machine learning er introduceret i en 2013
papir.
Forskere har skabt et hierarki af tre support vektor maskine, eller SVM, kriterier for klassificering til at skelne de fine detaljer.
De udførte finkornet hjem placering slutning af Twitter brugere ved at træne en SVM klassificeringen til at forudsige hjem sted for aktive brugere-dem med fem eller flere, der er geotagget tweets indenfor 100-x-100-meter-net.
For hver af SVM, holdet har brugt 80 procent af de markerede data til undervisning og resten til test. Det, der er ansat femdoblet cross-validering.
Holdet skrev sin egen software i Python og brugte scikit-lære bibliotek, sagde Professor Henry Kautz, direktør for Institut for Data Videnskab på Rochester Universitet.
Ikke Bare for Nabbing Berusede Diskanter
Den metode, der kan bruges til at analysere, hvad brugerne af de sociale medier gør, hvis de indlæg om deres aktiviteter, når de gør det, og, hvis deres udstyr er location-aktiveret.
Analysere folks placering og indhold sammen og sammenholde det har været gjort før, påpegede Mukul Krishna, en ledende global director hos Frost & Sullivan.
“Holdningen er generelt,” fortalte han TechNewsWorld. “Den nye ideer er en måde at skelne mellem tweets, der er om et emne, som i almindelighed fra dem, der er omkring brugeren gør, at ting i det øjeblik og gætte brugerens hjem.”
De data, der kan bruges til at bygge fællesskaber af mennesker, så segment disse fællesskabers medlemmer og tjene op gennem ad udvekslinger, meget målrettede annoncer til det segment, Krishna.
Den tilgang, der kan anvendes i forbindelse med valget. “Hvis et betydeligt antal mennesker drøftet en bestemt kandidat…, konklusioner er i overensstemmelse med, hvad der blev drøftet kunne være gjort,” foreslog Rob Enderle, ledende analytiker hos Enderle Group.
Det kunne også hjælpe med at beslutte, hvor at finde en virksomhed. “Baseret på rejsemønstre af prøven, bruger kunne [omfatter] ideer, hvor at bygge den næste store bar,” fortalte han TechNewsWorld.
Marketing og annoncering kan også blive yderligere forbedret, så “kan du sandsynligvis selv foretage præcise opdelinger, der er baseret på alder og køn ud fra de oplysninger, der leveres af Twitter,” Enderle anede.
Det kan give bagslag, selv om, fordi “jo mere effektiv bliver den i form af dens bruge til at målrette mod forbrugerne, så de mere negative reaktion og modreaktion vi vil se fra folk, der mener, at privatlivets fred er vigtigere end effektiv markedsføring,” Larry Chiagouris, en professor i marketing på
Pace University, fortalte TechNewsWorld.
Eller måske ikke. Forbrugerne er villige til at dele personlige oplysninger,
Sitecorefound, for at få en mere tilpasset kundernes oplevelse, når de køber online.