Wikipedia Använder AI för att Hjälpa Mänskliga Redaktörer

Den
Wikimedia Foundation den här veckan rullat ut en tjänst för att förbättra kvaliteten i Wikipedia.

Wikipedia Uses AI to Assist Human Editors

Målet Revidering Utvärdering Service använder artificiell intelligens och maskininlärning för att hjälpa svenskspråkiga Wikipedia identifiera skadliga artiklar snabbare och tilldela kvalitet poäng till dem snabbare.

Varje dag, Wikipedia är redigerat några 500 000 gånger, Wikimedia sagt. Redaktörer, de flesta av dem är frivilliga, att se alla dessa förändringar.

MALMER ger de som är redaktörer för att kika in inkommande innehåll för att identifiera potentiellt skadliga ändringar snabbt och karantän dem för framtida kontroll.

En skada redigera kan omfatta införande av personliga åsikt eller olämpligt material till en artikel.

Redigera Triage

“Om du är i media alls, det finns en chans att någon kommer att tycka illa om något som du sagt och kommer att försöka att skada din Wikipedia-sida,” säger Rob Enderle,
främsta analytiker på Enderle Group.

Detta beteende, men passar en mönster-ett mönster som ett system som MALMER kan ta itu med. “Låg nivå AI är verkligen bra på att identifiera mönster och att vidta föreskrivna åtgärder mot de mönster som den känner igen,” han berättade TechNewsWorld.

“Om du inte har ett ton mer människor än Wikipedia har, du skulle aldrig kunna hålla upp med dåliga redigeringar,” sade Enderle.

Med MALMER, “Wikipedia kan vara mer tillförlitliga och mindre benägna att användas som ett verktyg för att skada någon”, tillade han.

Det erbjuder svenskspråkiga Wikipedia med en svit av verktyg som de kan använda för att hjälpa dem att sortera redigeringar av sannolikheten för att de är skadliga.

“Det låter som editor för att granska de sannolikt kommer att vara skadligt redigeringar först,” sade Wikimedia Senior Research Scientist Aron Halfaker. “Det kan minska arbetsbördan för att granska ändringar om 90 procent.”

Mindre Redigering, Fler Artiklar

MALMER förutspår sannolikheten för att en redigering skada genom att rita på kunskap av att jämföra före-och-efter redigeringar av alla artiklar som visas i Wikipedia.

Det använder denna kunskap för att tilldela poäng till ett förslag på redigera. Poängen kan hämtas snabbt — 50 till 100 millisekunder — och kan användas för att identifiera problematiska redigeringar snabbt.

Omkring 3 till 4 procent av den dagliga redigeringar Wikipedia-artiklar är skadligt. Ogräsrensning de skadliga redigeringar från firehose redigeringar översvämningar Wikipedia varje dag är en grannlaga uppgift för redaktörer. Det är mindre så med MALMER, Wikipedia sade.

“Vår machine learning-modellen är tillräckligt bra på att sortera dessa redigeringar av sannolikheten för att de är skadliga att du skulle behöva se över 10 procent av inkommande redigeringar att veta att du fångade alla skadliga ändringar,” Halfaker berättade TechNewsWorld. “Utan detta verktyg, skulle du ha för att granska alla ändringar vet att du fångade alla de skadliga ändringar.”

Även MALMER sig inte direkt till att förbättra kvaliteten på artiklarna på Wikipedia, det gör det indirekt genom att se till att redaktörer fånga alla skadliga innehåll och frigöra dessa redigerare för att skapa fler artiklar av sina egna.

“En av anledningarna till att vi vill minska arbetsbördan runt kvalitetskontroll är så att redaktörer kan lägga mer av sin tid för att arbeta på nya artikel innehåll snarare än att ta bort klotter,” Halfaker sagt.

Wikipedia får cirka 12 miljoner timmars frivilligt arbete ett år. “En hel del av vad dessa artificiell intelligens system som gör det är mer effektivt att tillämpa den mänskliga uppmärksamhet till problemet med att skriva en hög kvalitet encyclopedia,” sade han.

Teknikens Begränsningar

Även MALMER tar upp en aspekt av kvalitetssäkring på Wikipedia, en större fråga återstår, konstaterade Sorin Adam Matei, docent vid

Purdue University som studerar relationen mellan informationsteknik och sociala strukturer i kunskap marknader.

Rent vetenskapliga artiklar som omfattar ett smalt band av faktiska sanningen, gillar inlägget på pi, är mycket noggrann i Wikipedia. “Det är inte lätt att fejka dessa typer av artiklar,” han berättade TechNewsWorld.

I den samhällsvetenskapliga och humanistiska områden, men de artiklar som blivit mer och mer tvetydig information som läggs till dem, Matei fortsatte.

“Noggrannhet blir en omtvistad fråga. Det är inte det att de är inte korrekt. Det är berättelser som de bygger är så komplexa och svåra att läsa att när du kommer till slutet av dem, du vet inte vad jag ska tro,” sade han.

“Jag tror att Wikipedia är problemet är att det är produkten av många sinnen att dra det i alla möjliga riktningar, och bara en teknisk lösning för detta har inte uppfunnits ännu”, Matei sagt.

“De försöker inte ta itu med den verkliga meningsfull fråga som Wikipedia konfronterar oss med”, tillade han. “Det är inte så att Wikipedia leder oss vilse från sanningen, men det har byggt in alla typer av sanningar som du behöver för att se igenom noggrant.”

John Mello är en teknisk frilansskribent och bidragsgivare till Chief Security Officer tidningen. Du kan få kontakt med honom på
Google+.