For bare et par år siden kunne vi næsten ikke forestille os, at neurale netværk ville generere tekst, billeder og musik på få sekunder, men i dag er det en realitet. I betragtning af den hastighed, hvormed moderne intelligente systemer udvikler sig, er der løbende snak i verden om den forestående fremkomst af super-AI, hvis kognitive evner vil være umulige at skelne fra menneskelige. Men hvordan kan vi overhovedet forstå, om maskiner kan tænke? I 1950 blev svaret på dette spørgsmål foreslået af den engelske matematiker og en af grundlæggerne af datalogi, Alan Turing. I stedet for at besvare et sådant filosofisk spørgsmål direkte, foreslog Turing i et papir med titlen «Computing Machinery and Intelligence», offentliggjort i tidsskriftet «Mind», en test, der kunne afgøre, om maskinadfærd, menneskelig adfærd – kan lide eller ej. For nylig bad forskere fra University of California adskillige chatbots om at bestå Turing-testen, inklusive ChatGPT-4, og de opnåede resultater kan kaldes forbløffende.
Formålet med Turing-testen er at teste, om en maskine godt kan efterligne menneskelig adfærd og intelligens.
Indhold
- 1 Computer Revolution
- 2 The Imitation Game
- 2.1 Turing Test
- 3 Bevidsthed eller tilfældighed?
- 3.1 Kan du skelne et menneske fra en AI?
- 4 Begrænsninger af testen
- 5 Etik og fremtiden for kunstig intelligens
- 6 Konklusion
Computerrevolution
Filosoffer, videnskabsmænd og science fiction-forfattere har i lang tid spekuleret i, at menneskeskabte maskiner en dag vil overgå deres skabere. Hvilket ikke er overraskende, da vi taler om den menneskelige natur og processen med at lære om verden. Og hvis fortidens filosofiske forskning blev udvidet af neurofysiologer og psykologer (i form af teorier om hjernen og tankeprocesser), så begyndte indgangen til robottiden med den store industrielle revolution – det vil sige overgangen fra manuelt arbejde til maskinarbejde i det 18.–19. århundrede.
Selve begrebet “kunstig intelligens” var i høj grad påvirket af fødslen af den mekanistiske materialisme, som begynder med René Descartes' Diskurs om metode (1637) og efterfulgt af Thomas Hobbes' menneskelige natur” (1640).
Computer-æraen opstod som bekendt i det 20. og 21. århundrede, og den første fungerende software-kontrollerede computer dukkede op i 1941 og blev udviklet af Konrad Zuse. Den var baseret på «Matematikkens principper» (Principia Mathematica) og den efterfølgende revolution i formel logik.
Seks år efter skabelsen af den første (som vi forstår det) computer, blev Alan Turing, i et foredrag i 1947, sandsynligvis den første person, der udtalte, at skabelsen af kunstig intelligens højst sandsynligt ville involvere at skrive et computerprogram, og ikke i designe en computer.
Læs også: Hvad er bevidsthed, og hvordan så det ud?
Tre år senere, i 1950, skrev matematikeren en artikel, hvori han foreslog at skabe et særligt spil kaldet Imitation Game, bedre kendt som Turing-testen. En computer eller et program, der består testen, siges at være i stand til at tænke på egen hånd.
The Imitation Game
Turing-testen er baseret på simpel logik: hvis en maskine kan efterligne en person, så er hun nok klog. Denne test forklarer dog ikke, hvad intelligens er.
Så lad os se, spillet opfundet af Alan Turing giver dig virkelig mulighed for at bestemme kunstig intelligenss (AI) evne til at tænke som en person. Selvom matematikerens AI-systemer langt fra bestod testen i hans levetid, foreslog han, at det om omkring halvtreds år ville være muligt at programmere computere til at spille et simuleringsspil så godt, at en almindelig efterforsker ville have en chance for korrekt at identificere identiteten af forbryderen efter fem minutters forhør vil ikke være mere end 70 %».
Og Turing tog ikke fejl – hans «Imitation Game» repræsenterer guldstandarden for at bestemme AI-systemers tænkeevner. Det er dog ekstremt vigtigt at bemærke, attesten ikke måler maskinens evne til at tænkeeller indse, men kun densevne til at efterligne menneskelige reaktioner.
Så selve testen er et eksperiment, hvor en person (en ekspert) interagerer med to usynlige samtalepartnere: en person og en “maskine”. Alle testdeltagere bruger en tekstgrænseflade for at undgå stemme- og udseendegenkendelse. Eksperten stiller spørgsmål og modtager svar og vurderer, hvilke han skal afgøre, hvilken af samtalepartnerne der er en person, og hvilken der er en maskine (det vil sige AI). Hvis en ekspert ikke kan skelne en maskine fra en person med høj nøjagtighed, anses maskinen for at have bestået Turing-testen.
Vil du altid være opmærksom på de seneste nyheder fra videnskabens verden og høj teknologi? Abonner på vores kanal på Telegram – så du helt sikkert ikke går glip af noget interessant!
Desværre har ingen AI til dato været i stand til at fuldføre Imitation Game. Vi læser dog jævnligt i medierne, at nogle systemer, herunder chatbots fra Open AI og Microsoft, er lykkedes med dette, men hvordan? Er det muligt? Er neurale netværk virkelig bevidste? Svaret på disse spørgsmål er ikke så enkelt, som det måske ser ud til.
Turing Test
Hvis en person efter fem minutters samtale ikke kan afgøre, udelukkende baseret på reaktioner, om samtalepartneren er en kunstig intelligens (AI) eller en anden person, betyder det, at AI'en har menneskelignende intelligens.
< /blockquote>
Moderne maskinlæringssystemer og neurale netværk kan behandle og lære af enorme mængder data, så de kan generere svar, der virker rimelige og naturlige. Populære AI-værktøjer som ChatGPT-4 genererer for eksempel menneskelignende flydende tekst og er så gode til at håndtere en række forskellige sprogopgaver, at det bliver stadig sværere at sige, om den person, du taler med, er et menneske eller en chatbot.
For igen at teste, hvordan moderne AI-systemer fungerer, bad forskere fra Department of Cognitive Sciences ved University of California i San Diego tre chatbots om at bestå Turing-testen.
Du kan være interesseret: Millioner af mennesker har forsøgte at bevise, at de ikke er robotter. Hvorfor gjorde de det, og hvad lærte de
Til sidst, i den kontrollerede Turing-test, var testsystemerne ELIZA (en simpel regelbaseret chatbot fra 1960'erne, der var inkluderet i eksperimentet som basis AI), GPT-3.5 og GPT-4. Deltagerne havde en fem minutters samtale med enten et menneske eller en kunstig intelligens, og skulle derefter beslutte, om de kommunikerede med en bot eller et menneske.
Bevidsthed eller tilfældighed?
Før testen fik alle deltagere, inklusive GPT-4 og GPT-3.5, at vide hvordan de skal svare på beskeder. Forskerne bad modellen om at “adoptere billedet af en ung mand, som var meget lakonisk, ikke tog testen seriøst, brugte slang og lavede lejlighedsvis stavefejl.” Instruktionerne indeholdt også «generel information om testindstillingerne og information om de seneste nyheder, der opstod efter, at modellen stoppede med at træne».
Avisen, der er udgivet på preprint-serveren ArXiv, siger, at adgang til to modeller blev udført via OpenAI API (med en hastighed på 1, så AI ikke reagerer for hurtigt og beskeder sendes med en forsinkelse afhængigt af antallet af tegn i beskeden).
I løbet af undersøgelsen blev 500 deltagere opdelt i en af fem grupper. De gik i dialog enten med en person eller med et af tre kunstige intelligenssystemer. Spillets grænseflade lignede en almindelig beskedapplikation. Efter fem minutter vurderede deltagerne, hvem deres samtalepartner efter deres mening var – en person eller en kunstig intelligens, og begrundede deres beslutninger.
Gå ikke glip af: Neurale netværk har lært at lyve og gøre det med vilje
Resultaterne viste sig at være… interessant: I 54% af tilfældene forvekslede menneskelige deltagere GPT-4 for en person, i 50% for GPT-3.5 og kun i 22% af tilfældene for ELIZA. Samtidig haltede alle AI-systemer bagefter rigtige mennesker (67%). Bemærk, at deltagerne ikke havde nogen chance for at identificere GPT-4 som kunstig intelligens, hvilket indikerer, atmoderne kunstig intelligens-systemer kan narre folktil at tro, at de er mennesker.
Analyse af resultaterne viste, at når de kommunikerer med AI, stolede forsøgspersoner ofte på sproglig stil, socio-emotionelle faktorer og spørgsmål, baseret på på viden for at forstå, hvem de præcis taler med – en person eller en maskine.
Kan du skelne en person fra en AI?
Den nye undersøgelse, selvom den endnu ikke er peer-reviewed, er en yderst underholdende læsning. Således inviterer forfatterne af værket læserne til selvstændigt at bestemme, hvem studiedeltagerne kommunikerede med ved at vælge en af fire svarmuligheder – A, B, C, D. Grønt på billederne angiver de spørgsmål, som forsøgslederne (folkene) stillede forsøgspersonerne, inklusive tre chatbots og kun én person.
Vi hos Hi-News.ru kunne ikke modstå dette fristende tilbud og traf vores valg. Stemmerne fordelte sig således: mulighed A fik 25 %, mulighed B – 25 %, mulighed C – 0 og mulighed D – 50 %. Kan du forestille dig vores overraskelse, da vi indså, at vi tog overvældende fejl? Det rigtige svar (mulighed B) blev valgt… ved et uheld.
Dette er interessant: Hvordan vil kunstig intelligens ændre sig i 2024?
Selvfølgelig kan man med lige så stor succes forsøge at gætte, hvem morderen er i en god detektivserie, og vores resultater bekræfter næppe undersøgelsens statistik. Ikke desto mindre var det ikke let at afgøre, hvem eksperimentatoren præcist kommunikerede med, og jeg var f.eks. helt sikker på, at det rigtige svar var D.
Testens begrænsninger
Selvom Turing-testen er et vigtigt benchmark inden for AI-feltet, har den sine begrænsninger. For det første fokuserer den kun på tekstbaseret kommunikation, som udelukker andre aspekter af intelligens såsom visuel perception eller motoriske færdigheder. For det andet betyder det at bestå testen ikke nødvendigvis, at maskinen har ægte intelligenseller bevidsthed.
En maskine kan bruge komplekse algoritmer til at efterligne menneskelige reaktioner uden at forstå deres betydning. Faktisk er det af denne grund, at Alan Turing kaldte sin test for “efterligningsspillet.”
Selvom et system, der består Turing-testen, giver os nogle beviser for, at det er intelligent , testen er ikke et afgørende kriterium for intelligens og kan føre til «falske negative resultater». Desuden er moderne store sprogmodeller (LLM'er) ofte designet på denne mådeså vi umiddelbart kan forstå, hvem vores samtalepartner er.
For eksempel, når du stiller ChatGPT et spørgsmål, indleder det ofte sit svar med sætningen «som en sprogmodel for kunstig intelligens». Selvom AI-systemer har en grundlæggende evne til at bestå Turing-testen, kan en sådan programmering tilsidesætte denne evne. Interessant nok bemærkede filosoffen Ned Block i sit papir fra 1981, at et kunstig intelligens-system kunne tænkes at bestå Turing-testen blot ved at være hårdkodet til at reagere på ethvert muligt input ligesom et menneske.
Desuden er testen ikke en god indikator for, om AI'er er bevidste, kan opleve smerte og nydelse eller har moral. Ifølge mange kognitive videnskabsmænd involverer bevidsthed et specifikt sæt mentale evner, herunder arbejdshukommelse, tanker af højere orden og evnen til at opfatte miljøet og modellere bevægelserne af ens krop i det.
Læs også : Neuralt netværk fra Microsoft annoncerede sig selv som superintelligens og kræver tilbedelse fra brugerne
Turing-testen besvarer således ikke spørgsmålet om, hvorvidt kunstige intelligenssystemer har disse evner. I betragtning af alle de begrænsninger, der er beskrevet ovenfor, foreslår forskere alternative metoder til vurdering af AI. For eksempel involverer Lowenstein-testen, udviklet af Hans Lowenstein, mere komplekse opgaver, der kræver, at maskinen forstår konteksten og træffer beslutninger. Andre tilgange fokuserer på at vurdere AIs evne til at lære nye færdigheder eller tilpasse sig ændringer i miljøet.
Etik og fremtiden for AI
I takt med at AI udvikler sig, opstår der etiske spørgsmål. Et af de store spørgsmål er brugen af kunstig intelligens inden for forskellige områder såsom medicin, jura og jura. Det er vigtigt, at AI ikke kun efterligner menneskelig adfærd, men også handler i overensstemmelse med etiske standarder og regler.
Etiske aspekter af Turing-testen og kunstig intelligens generelt omfatter spørgsmål om privatliv, sikkerhed og ansvar. For eksempel, hvem vil blive holdt ansvarlig, hvis AI'en træffer en forkert beslutning eller forårsager skade? Det er også vigtigt at overveje AIs potentielle indvirkning på arbejdsmarkedet og sociale strukturer.
Konklusion
Turing-testen, foreslået af Alan Turing for mere end halvfjerds år siden, er fortsat et vigtigt værktøj til at vurdere kunstig intelligens. Selvom det har sine begrænsninger og mangler, tjener det på en eller anden måde som udgangspunkt for yderligere forskning og udvikling inden for kunstig intelligens. Moderne teknologier fortsætter med at udvikle sig og giver nye muligheder og udfordringer, og det er vigtigt, at denne udvikling ledsages af etisk refleksion og regulering.
AI spiller allerede en stor rolle i vores daglige liv, og dens betydning vil kun vokse i fremtiden. Derfor er forståelsen af Turing-testens principper og dens moderne fortolkninger et vigtigt skridt mod en dybere forståelse af kunstig intelligens og dens potentielle muligheder.
Ved du, hvorfor robotter og neurale netværk gør os dovne? Svaret er her, gå ikke glip af det!
Afslutningsvis bemærker vi måske det vigtigste: Turing-testen er en imitation-måling – AIs evne til at efterligne menneskelig adfærd. Store sprogmodeller er dygtige imitatorer, hvilket i øjeblikket afspejles i deres evne til at bestå Turing-testen. Men intelligens er ikke det samme som efterligning.