ChatGPT-4 klarade det mänskliga testet för första gången

För bara några år sedan kunde vi knappt föreställa oss att neurala nätverk skulle generera text, bilder och musik på bara ett par sekunder, men idag är det verklighet. Med tanke på den hastighet med vilken moderna intelligenta system utvecklas, pratas det pågående i världen om den förestående uppkomsten av super-AI vars kognitiva förmågor kommer att vara omöjliga att skilja från mänskliga. Men hur kan vi ens förstå om maskiner kan tänka? År 1950 föreslogs svaret på denna fråga av den engelske matematikern och en av grundarna av datavetenskap, Alan Turing. Istället för att svara direkt på en sådan filosofisk fråga föreslog Turing i en artikel med titeln «Computing Machinery and Intelligence», publicerad i tidskriften «Mind», ett test som kunde avgöra om maskinbeteende, mänskligt beteende -gillar eller inte. Nyligen bad forskare från University of California flera chatbots att klara Turing-testet, inklusive ChatGPT-4, och resultaten de fick kan kallas fantastiska.

ChatGPT-4 klarade det mänskliga testet för första gången. Har neurala nätverk verkligen fått förmågan att tänka som människor? Bild: the-decoder.com. Foto.

Har neurala nätverk verkligen fått förmågan att tänka som människor? Bild: the-decoder.com

Syftet med Turing-testet är att testa om en maskin väl kan imitera mänskligt beteende och intelligens.

Innehåll

  • 1 Computer Revolution
  • 2 The Imitation Game
    • 2.1 Turingtest
  • 3 Medvetande eller slumpmässighet?
    • 3.1 Kan du skilja en människa från en AI?
  • 4 Testets begränsningar
  • 5 Etik och framtiden för AI
  • 6 Slutsats

Datorrevolution

Filosofer, vetenskapsmän och science fiction-författare har länge spekulerat i att konstgjorda maskiner en dag kommer att överträffa sina skapare. Vilket inte är förvånande, eftersom vi talar om den mänskliga naturen och processen att lära sig om världen. Och om det förflutnas filosofiska forskning utvidgades av neurofysiologer och psykologer (i form av teorier om hjärnan och tankeprocesser), så började inträdet i robottiden med den stora industriella revolutionen – det vill säga övergången från manuellt arbete till maskinarbete under 1700-1800-talen.

Själva begreppet “artificiell intelligens” påverkades i hög grad av den mekanistiska materialismens födelse, som börjar med René Descartes Discourse on Method (1637) och följs av Thomas Hobbes Human Nature (1640).

< p>Datoreran, som vi vet, inträffade på 1900- och 2000-talen, och den första fungerande programstyrda datorn dök upp 1941 och utvecklades av Konrad Zuse. Den var baserad på «Matematikens principer» (Principia Mathematica) och den efterföljande revolutionen inom formell logik.

1938 slutförde den tyske ingenjören Konrad Zuse utvecklingen av Z1, den första datorn. Bild: hackaday.com

Sex år efter skapandet av den första (som vi förstår det) datorn, blev Alan Turing, i sin föreläsning 1947, förmodligen den första personen att säga att skapandet av artificiell intelligens skulle vara mer benägna att involvera att skriva ett datorprogram snarare än att designa en dator.

Läs också: Vad är medvetande och hur såg det ut?

Ytterligare tre år senare – 1950 – skrev en matematiker en artikel där han föreslog att skapa ett speciellt spel som heter «Imitation Game& # 187;bättre känt som Turing-testet. En dator eller ett program som klarar testet sägs kunna tänka själv.

The Imitation Game

Turingtestet är baserat på enkel logik: om en maskin kan imitera mänskligt beteende så är den förmodligen smart. Detta test förklarar dock inte vad intelligens är.

Så låt oss se, spelet som uppfanns av Alan Turing låter dig verkligen bestämma förmågan hos artificiell intelligens (AI) att tänka som en person. Även om matematikerns AI-system var långt ifrån att klara testet under hans livstid, föreslog han att det om cirka femtio år skulle vara möjligt att programmera datorer för att spela ett spel av imitation så bra att en vanlig utredare skulle ha en chans att korrekt identifiera identiteten på brottslingen efter ett fem minuters förhör kommer inte att vara mer än 70%.

Och Turing hade inte fel – hans «Imitation Game» representerar guldstandarden för att bestämma tankeförmågan hos AI-system. Det är oerhört viktigt att förstå att testet inte mäter maskinens förmåga att tänka eller vara medveten, utan bara dess förmåga att imitera mänskliga svar.

Alan Turing är en engelsk matematiker, logiker, kryptograf som hade ett betydande inflytande på utvecklingen av datavetenskap. Bild: media.licdn.com

Så själva testet är ett experiment där en person (en expert) interagerar med två osynliga samtalspartner: en person och en “maskin”. Alla testdeltagare använder ett textgränssnitt för att undvika röst- och utseendeigenkänning. Experten ställer frågor och får svar och bedömer vilka han måste avgöra vilken av samtalspartnerna som är en person och vilken som är en maskin. Om experten inte kan skilja en maskin från en person med hög noggrannhet, anses maskinen ha klarat Turing-testet.

Vill du alltid vara medveten om de senaste nyheterna från vetenskapens och högteknologins värld? Prenumerera på vår kanal på Telegram – så att du definitivt inte missar något intressant!

Ack, hittills har ingen AI lyckats slutföra «Imitationsspelet». Vi läser dock regelbundet i media att vissa system, inklusive chatbots från Open AI och Microsoft, har lyckats. Men hur är detta möjligt? Är neurala nätverk verkligen medvetna? Svaren på dessa frågor är inte så enkla som de kan verka.

Turing Test

Om en person inte kan förstå under fem minuters konversation om han kommunicerar med en AI eller med en annan person, så har AI:n en intelligens som liknar en människas.

Moderna maskininlärningssystem och neurala nätverk kan bearbeta och lära av stora mängder data, vilket gör att de kan generera svar som verkar rimliga och naturliga. Populära verktyg för artificiell intelligens som ChatGPT-4, till exempel, genererar text och är så bra på att hantera olika språkuppgifter att det blir allt svårare att avgöra om personen du pratar med är en människa eller en chatbot.

Resultaten av studien visade att det inte är så lätt att avgöra exakt vem du kommunicerar med. Bild: cdn2.psychologytoday.com

För att återigen testa hur moderna AI-system fungerar bad forskare från institutionen för kognitiv vetenskap vid University of California i San Diego tre chatbots att klara Turing-testet.

Du kanske är intresserad: Miljontals människor har försökte bevisa att de inte är robotar. Varför gjorde de det och vad lärde de sig

Så slutligen, i det kontrollerade Turing-testet, var testsystemen ELIZA (en enkel regelbaserad chatbot från 1960-talet som ingick i experimentet som bas-AI),GPT-3.5ochGPT-4. Deltagarna pratade med antingen en människa eller en artificiell intelligens i fem minuter och fick sedan bestämma sig för vilken de pratade med.

Medvetande eller slump?

Innan testet fick alla modeller industriella uppgifter om hur man svarar på meddelanden. Forskarna bad modellerna att “anta bilden av en ung man som kommunicerar kortfattat, inte tar testet på allvar, använder slang och ibland gör stavfel.” Instruktionerna inkluderade också «allmän information om testinställningar och senaste uppdateringar».

Artikeln, som publicerades på ArXiv preprint-server, anger att de två modellerna nås via OpenAI API (på en låg hastighet så att AI:n inte reagerar för snabbt, och meddelanden skickas med en fördröjning beroende på antalet tecken i meddelandet).

Medvetande eller slumpmässighet? Tre AI:er och en människa som klarar Turing-testet. Bild: arxiv.org. Foto.

Turingtest som passerade tre AI:er och en människa. Bild: arxiv.org

Under studien delades 500 deltagare in i fem grupper och gick in i en dialog med antingen en person eller ett av tre artificiell intelligenssystem. Spelets gränssnitt liknade ett vanligt meddelandeprogram. Efter fem minuter betygsatte deltagarna vem de trodde att deras samtalspartner var och motiverade sina beslut.

Missa inte: Neurala nätverk har lärt sig att ljuga och gör det med flit

Resultaten var… intressant: i 54 % av fallen misstog mänskliga deltagare GPT-4 för en person, i 50 % för GPT-3.5 och endast i 22 % av fallen för ELIZA. Samtidigt släpade alla AI-system efter verkliga människor i 67 % av fallen. Observera att deltagarna inte hade den minsta chansen att identifiera GPT-4 som artificiell intelligens, vilket tyder på attmoderna artificiella intelligenssystem kan lura människorlåtsas vara människa.

Analys av resultaten visade att försökspersoner ofta förlitade sig på språklig stil, socio-emotionella faktorer och kunskap när de kommunicerade med AI för att förstå om de pratade med en person eller en maskin.< /p>

Kan du skilja en människa från en AI?

Den nya studien, även om den ännu inte har granskats av experter, är mycket underhållande läsning. Således inbjuder författarna till arbetet läsare att självständigt bestämma med vem studiedeltagarna kommunicerade med genom att välja ett av fyra svarsalternativ – A, B, C, D. Grönt i bilderna indikerar frågorna som experimentörerna (människor) ställde till försökspersonerna, inklusive tre chatbots och bara en person.

Kan du skilja en människa från en AI? Det finns fyra dialogrutor framför dig (A,B,C,D). Studera dem noggrant för att avgöra vilken som är mänsklig. Bild: arxiv.org. Foto.

Det finns fyra dialogrutor framför dig (A,B,C,D). Studera dem noggrant för att avgöra vem av dem som är mänsklig. Bild: arxiv.org

Vi på redaktionen för Hi-News.ru kunde inte motstå detta frestande erbjudande och gjorde vårt val. Rösterna fördelade sig enligt följande: alternativ A fick 25 %, alternativ B – 25 %, alternativ C – 0 % och alternativ D – 50 %. Kan du föreställa dig hur förvånade vi blev när vi insåg att vi hade fel? Rätt svar (alternativ B) valdes… av en slump.

Det här är intressant: Hur kommer artificiell intelligens att förändras 2024?

Självklart kan man lika framgångsrikt försöka gissa vem som är mördaren i en bra detektivserie, och våra resultat bekräftar knappast studiens statistik . Ändå var det inte lätt att avgöra exakt vem försöksledaren kommunicerade med, och jag var till exempel helt säker på att det korrekta svaret var D.

Testets begränsningar

Även om Turing-testet är ett viktigt riktmärke inom AI-området, har det sina begränsningar. För det första fokuserar den bara på textbaserad kommunikation, vilket utesluter andra aspekter av intelligens som visuell perception eller motorik. För det andra, att klara testet betyder inte nödvändigtvis att maskinen har sann intelligenseller medvetande.

Maskinen kan använda komplexa algoritmer för att imitera mänskliga svar utan att förstå deras innebörd. Det var faktiskt av denna anledning som Alan Turing kallade sitt test för “imitationsspelet.”

Även om ett system som klarar Turing-testet ger oss vissa bevis på att det är intelligent, är testet inte ett definitivt mått på intelligens och kan leda till «falska negativa resultat». Dessutom är moderna stora språkmodeller (LLM) ofta utvecklade på ett sådant sättatt vi omedelbart kan förstå vem vår samtalspartner är.

Om att klara Turing-testet är ett bra bevis på att ett system är intelligent, så är det inte ett bra bevis på att systemet inte är intelligent . Bild: www.ryans.com

Till exempel, när du ställer en fråga till ChatGPT, föregår det ofta svaret med frasen «som en språkmodell för artificiell intelligens». Även om AI-system har en grundläggande förmåga att klara Turing-testet, kan sådan programmering åsidosätta den förmågan. Intressant nog, i sin uppsats från 1981, noterade filosofen Ned Block att ett AI-system kunde tänkas klara Turing-testet helt enkelt genom att vara hårdkodat för att svara på alla inmatningar som en människa.

Dessutom är testet inte en bra indikator på om AI: er är medvetna, kan uppleva smärta och njutning eller har moral. Enligt många kognitiva forskare inkluderar medvetandet en viss uppsättning mentala förmågor, inklusive minne, tänkande, förmågan att uppfatta omgivningen och simulera kroppens rörelser i den.

Läs också: Microsofts neurala nätverk förklarade själv superintelligens och kräver dyrkan från användare

Turing-testet svarar alltså inte på frågan om artificiell intelligens har dessa förmågor. Tja, med tanke på de befintliga begränsningarna erbjuder forskare alternativa metoder för att bedöma AI. Till exempel Lowenstein-testet, utvecklat av Hans Lowenstein, som innebär mer komplexa uppgifter som kräver att maskinen förstår sammanhang och fattar beslut. Andra metoder fokuserar på att bedöma AI:s förmåga att lära sig nya färdigheter eller anpassa sig till förändringar i miljön.

Etik och framtiden för AI

Med utvecklingen av AI uppstår etiska frågor. En av huvudfrågorna är användningen av AI inom områden som medicin och juridik. Det är viktigt att AI inte bara imiterar mänskligt beteende, utan också agerar i enlighet med etiska standarder och regler.

AI har spruckit in i våra liv och förändrar snabbt allt runt omkring. Bild: digialpsltd.b-cdn.net

De etiska övervägandena av Turing-testet och AI i allmänhet inkluderar frågor om integritet, säkerhet och ansvar. Till exempel, vem kommer att hållas ansvarig om AI:n fattar ett felaktigt beslut eller orsakar skada? Det är också viktigt att överväga den potentiella påverkan av AI på arbetsmarknaden och samhället.

Slutsats

Även om Turing-testet har sina begränsningar och brister, fungerar det på något sätt som en startpunkt för vidare forskning och utveckling inom området AI. Modern teknik fortsätter att utvecklas och ger nya möjligheter och utmaningar, så det är viktigt att denna utveckling åtföljs av etisk reflektion och reglering.

Slutsats: Moderna AI-system efterliknar mänsklig kommunikation. Bild: digitaleconomy.stanford.edu/. Foto.

Moderna AI-system imiterar mänsklig kommunikation. Bild: digitaleconomy.stanford.edu/

Vet du varför robotar och neurala nätverk gör oss lata? Svaret är här, missa inte det!

AI spelar redan en stor roll i vårt dagliga liv, och dess betydelse kommer bara att växa i framtiden. Därför är att förstå principerna för Turing-testet och dess moderna tolkningar ett viktigt steg mot en djupare förståelse av artificiell intelligens och dess potentiella kapacitet. Sammanfattningsvis är det kanske viktigaste att Turing-testet är ett mått på imitation – det vill säga förmågan hos AI att imitera mänskligt beteende. Och det är detta som stora språkmodeller är bra på.


Date:

by