Hvordan en AI-Algoritmen Lært å Skrive Politiske Taler

Politiske taler er ofte skrevet for politikere ved pålitelige medhjelpere og confidantes. Kan en AI-algoritmen gjøre så godt?

“Spør ikke hva landet ditt kan gjøre for deg, spør hva du kan gjøre for ditt land.”
—John F. Kennedy, 1961

Når det kommer til politiske taler, store de er få og langt mellom. Men vanlige politiske taler, de som er gitt i AMERIKANSKE kongressens etasje debatter, for eksempel, er mange.

De er også bemerkelsesverdig lik. Disse taler har en tendens til å følge en standard format, gjenta lignende argumenter, og selv bruker de samme ordene for å angi en bestemt politisk tilknytning eller meninger. Det er nesten som om det er en slags algoritme som bestemmer innholdet.

Det reiser et interessant spørsmål. Er det mulig for maskinen å skrive disse typer politiske taler automatisk?

I dag, får vi et svar takk til arbeidet med Valentin Kassarnig ved University of Massachusetts Amherst, som har skapt en kunstig intelligens maskin som har lært seg å skrive politiske taler som er forbausende lik ekte taler.

Den tilnærming er grei i prinsippet. Kassarnig brukt en database med nesten 4000 politiske tale segmenter fra 53 AMERIKANSKE Kongressens etasje debatter for å trene en maskin-læring algoritmen for å produsere taler av sine egne.

Disse taler består av over 50 000 setninger som alle inneholder 23 ord i gjennomsnitt. Kassarnig også kategorisert foredrag ved politisk parti, om Demokrat eller Republikaner, og av om det var i favør eller mot et gitt tema.

Selvfølgelig, djevelen er i detaljene om hvordan å analysere denne databasen. Etter å ha prøvd en rekke teknikker, Kassarnig avgjort på en tilnærming basert på n-gram, som er sekvenser av “n” ord eller uttrykk. Han ble først analysert teksten ved hjelp av en deler-til-tale-tilnærming som koder hvert ord eller uttrykk med sine grammatiske rolle (om til et substantiv, verb, adjektiv, og så videre).

Han så på 6-gram, og sannsynligheten for et ord eller en frase som vises gitt de fem som vises før det. “Som gir oss muligheten til å finne ut veldig raskt alle ord som kan oppstå etter at de fem siste, og hvor sannsynlig hver av dem,” sier han.

Prosessen med å generere taler automatisk følger av dette. Kassarnig begynner ved å fortelle algoritmen hva slags ytringer det er ment å skrive om for Demokratene eller Republikanerne. Algoritmen for deretter å utforske 6-gram database for denne kategori for å finne hele settet av 5-gram som har vært brukt til å starte en av disse taler.

Algoritmen velger deretter ett av disse 5-gram tilfeldig til å starte sin tale. Det velger deretter det neste ordet fra alle de som kan følge dette 5-gram. “Da systemet begynner å forutsi ordet etter ordet inntil det spår slutten av talen,” sier han.

Det er noen triks underveis, selvfølgelig. Algoritmen vet, for eksempel, sannsynligheten for at et bestemt emne vil vises i en tale. Deretter velger emner ved å arbeide ut hva andre emner talen allerede inneholder og som avgjør hvor godt disse blir dekket.

Resultatene er overraskende gode. Her er et eksempel på en automatisk generert Demokratiske ytringer:

“Mr. Høyttaler, for år, ærlige, men uheldig forbrukere har hatt muligheten til å påberope seg sin sak å komme under konkursbeskyttelse og har rimelige og gyldig gjeld utladet. Måten systemet er ment å fungere, skifteretten vurderer ulike faktorer som inntekt, formue og gjeld for å finne ut hva gjelden kan bli betalt og hvordan forbrukerne kan komme tilbake på føttene. Stå opp for vekst og muligheter. Pass denne lovgivningen.”

Det er imponerende, gitt at det er ingen trening involvert andre enn den opprinnelige deler av tale-tags, 6-gram analyse av den politiske tale database og en liten bit of magic saus. Kassarnig har vurdert disse taler mot kriterier som grammatisk korrekthet, setning overgang og tale struktur og innhold, og fant at de generelt sett fungerer godt. “Spesielt, grammatisk korrekthet og setningen overganger i de fleste taler var veldig god, sier han.

Likevel, Kassarnig er ikke optimistisk om sin algoritme er sjansen for å ta den politiske scenen med storm. “Til tross for de gode resultatene det er svært usannsynlig at disse metodene vil være faktisk brukes til å generere taler for politikere,” sier han, formodentlig fordi den slags skruppelløse politiker som kan utnytte sin algoritme er så sjeldne (hoste).

Men algoritmen kan brukes til å generere andre typer tekster. Kassarnig tyder på at det kunne produsere nyheter, gitt andre historier på den samme hendelsen. Et annet alternativ kan være å lage blogginnlegg om arXiv papirer, gitt en stor database av lignende historier (ahem).

Og han oppfordrer alle til å ha en gå, sier at alle hans kildekoden er tilgjengelig på GitHub (https://github.com/valentin012/conspeech). “Vi eksplisitt oppfordrer andre til å prøve å bruke, modifisere og utvide det,” sier han. “Tilbakemeldinger og ideer til forbedring er hjertelig velkommen.”

Ref: arxiv.org/abs/1601.03313 : Politisk Tale Generasjon


Date:

by