AI tränad på en babys erfarenheter ger ledtrådar om hur vi lär oss språk

By | February 2, 2024

I ett och ett halvt år bar en bebis som hette Sam en kamera som var vänd mot framsidan i veckans sessioner som fångade hans värld: en sked närmade sig hans mun, en vårdare som skrek “Ugh!” medan du glider nerför en orange rutschkana eller när en katt sköter sig. Nu har forskare införlivat dessa bilder och ljud i ett relativt enkelt artificiell intelligensprogram för att undersöka en av de mest djupgående frågorna inom kognitionsvetenskap: Hur lär sig barn språk?

I en artikel som publicerades i torsdags i tidskriften Science rapporterar forskare vid New York University att AI, givet bara en liten bråkdel av ett barns fragmenterade upplevelser, kan börja urskilja ordningen i pixlar och lära sig att något existerar, som kallas spjälsäng. trappa eller ett pussel och matcha dessa ord korrekt med deras bilder.

Verktyget forskarna använde är inte en AI som lär sig som ett barn. Men forskning visar att AI kan plocka upp vissa grundläggande delar av språket från sensorisk information från ett enskilt barns erfarenhet, även utan redan existerande kunskaper om grammatik eller andra sociala färdigheter. Det är en del av en mycket bredare strävan att så småningom bygga en AI som efterliknar ett barns sinne, en helig gral av kognitiv vetenskap som kan hjälpa forskare att förstå vår egen utveckling och leda till AI som människor kan lära ut nya färdigheter på ett mer intuitivt sätt.

Chatbots, även känd som “stora språkmodeller”, har visat att AI som tränas på enorma mängder text kan producera en lyhörd samtalspartner med ett bländande språkbehärskning. Men många kognitiva vetenskapsmän hävdar att denna verbala bedrift inte stämmer överens med verklig mänsklig tanke.

Bebisar är motsatsen till en chatbot: de lär sig ord inte genom att snabbt smälta all text i världen, utan genom att vara i själva världen, genom sensorisk input och lek.

“Med våra beräkningar skulle det ta ett barn 100 000 år av att lyssna på talade ord för att nå ordantalet” av träningsuppsättningar för chatbots, säger Brenden Lake, en beräkningskognitiv forskare vid New York University som ledde studien. “Jag var också skeptisk till att de [chatbot] “Modellerna skulle kasta mycket ljus över mänskligt lärande och utveckling.”

Bebisar är motsatsen till en AI-chatbot: de lär sig ord inte genom att smälta all text i världen, utan genom sensorisk input och lek. (Video: Jonathan King)

Språkvetare, filosofer, kognitionsvetare och alltmer AI-utvecklare har Vi har alla varit förbryllade över hur människor lär sig språk.

I flera år har forskare försökt förstå hur barns sinnen tar form genom noggrant kontrollerade experiment. Många involverar leksaker eller dockor som gör att forskare kan testa när olika kognitiva färdigheter aktiveras. De har visat att 16 månader gamla bebisar kan använda statistiska resonemang för att avgöra om en noisemaker är trasig, och att bebisar så unga som 5 år gamla Månader vet att ett objekt fortfarande existerar även när de inte kan se det, en viktig utvecklingsmilstolpe som kallas objektpermanens.

Dessutom har vissa enskilda barn följts noga över tiden. Deb Roy, en vetenskapsman vid Massachusetts Institute of Technology, installerade antennkameror i alla rum i sitt hus 2005 och registrerade hennes sons språkliga utveckling, vilket gav en enorm mängd data som registrerar ordförvärvet och utvecklingen av ord. Det arbetet antydde att det inte var antalet gånger ett ord upprepades som förutspådde om Roys son lärde sig det tidigt, utan om det uttalades på en ovanlig plats i huset, i ett överraskande ögonblick eller i ett distinkt språkligt sammanhang.

Den innovativa användningen av framåtvända kameror har gett forskarna en ännu mer intim bild av den tidiga barndomen.

Sedan 2013 har flera familjer bidragit till SAYCam-databasen, en samling audiovisuella inspelningar av enskilda spädbarn och småbarn under en avgörande period av kognitiv utveckling, mellan 6 och 32 månader. Bebisarnas familjer, som bara identifieras med sina förnamn, sätter pannbandsmonterade kameror på sina barn i ungefär två timmar i veckan.

Forskare kan begära tillgång till data, som ger ett unikt fönster in i varje barns värld över tid och är tänkt att vara en resurs för forskare inom en mängd olika områden.

Sam, vars identitet är privat, är nu 11 år gammal. Men inspelningar från hans tidiga år i Australien gav Lake och hans kollegor 600 000 videorutor kombinerat med 37 500 transkriberade ord med träningsdata för deras AI-projekt.

De tränade sitt relativt enkla neurala nätverk med data som fångades när Sam var mellan 6 månader och 2 år gammal. De fann att AI lärde sig att matcha grundläggande namn och bilder med liknande noggrannhet som AI tränad på 400 miljoner bildtexter från webben.

Resultaten fördjupar sig i, men löser inte, en mångårig vetenskaplig debatt om de grundläggande kognitiva färdigheter som människor behöver inbyggda i sina hjärnor för att lära sig språk.

Det finns flera teorier om hur människor lär sig språk. Den framstående lingvisten Noam Chomsky föreslog idén om en medfödd, förkroppsligad språklig förmåga. Andra experter anser att vi behöver sociala eller induktiva resonemangsförmåga för att språket ska växa fram.

Den nya studien tyder på att viss språkinlärning kan ske i frånvaro av specialiserade kognitiva maskiner. Relativt enkel associativ inlärning (se boll, hör ”boll”) kan lära en AI att göra matchningar när det kommer till enkla namn och bilder.

“Det finns inget inbyggt i nätverket som ger modellen ledtrådar om språk eller hur språk bör struktureras”, säger studiens medförfattare Wai Keen Vong, forskare vid New York University.

Forskarna har inte jämförbara data om hur en 2-åring skulle utföra de uppgifter som AI:en stod inför, men de sa att AI:s färdigheter inte stämmer överens med ett litet barns. Till exempel kunde de spåra var AI:n fokuserade när de blev tillfrågade om olika ord och upptäckte att även om den fick några ord rätt som “bil” eller “boll”, såg den ut i fel område när den blev tillfrågad “katt”.

“Jag vill ta reda på de minsta ingredienser som behövs för att bygga en modell som kan lära sig mer som ett barn gör; det här är ett steg,” sa Lake.

Språkets grunder

Forskare vid New York University rapporterar att AI:n tränades under 61 timmar av Sams liv, mellan 6 månader och 2 år, för att lära sig hur man matchar grundläggande namn och bilder. (Video: Sams pappa)

AI:n skaffade sitt objektsordförråd genom att exponeras för 1 procent av Sams vakna timmar: 61 timmars filmmaterial samlats under ett och ett halvt år. Det som fascinerade utomstående forskare med studien var hur långt AI kom baserat på det och hur långt det fortfarande behövde gå för att rekapitulera mänskligt lärande.

“Det är verkligen viktigt och nytt att tillämpa dessa metoder på den här typen av datakälla, som är data från ett enda barns upplevelse, både visuell och auditiv”, säger Joshua Tenenbaum, en beräkningskognitiv forskare vid MIT som inte var involverad i studien. . arbete.

“Vad jag skulle vilja tillägga är att det fortfarande finns vissa saker som är svårare att dra exakta slutsatser från artikeln: vad detta säger oss om hur barn faktiskt lär sig ord är mindre tydligt.”

Michael Tomasello, en utvecklings- och jämförande psykolog vid Duke University, sa att AI-modellen kan spegla hur en hund eller papegoja kan lära sig ord. Experiment visar att vissa hundar kan lära sig mer än 100 ord för vanliga föremål eller gosedjur.

Men, noterade han, det är fortfarande oklart hur denna AI kunde ta sensorisk information och plocka upp verb, prepositioner eller sociala uttryck.

“Du kanske lär dig att ett återkommande visuellt mönster är 'docka'. Men hur lär han sig att samma föremål också är en “leksak”? Hur lär man sig “det här” eller “det” eller “det” eller “grejen”? skrev Tomasello i ett mejl.

Han noterade att AI-modellen tränad på barnets erfarenhet kunde identifiera saker som kan ses, och det är bara en liten del av språket som barn hör och lär sig. Han föreslog en alternativ modell, där istället för helt enkelt Genom att associera bilder med ljud skulle en AI behöva dra slutsatser om avsikten med kommunikationen att lära sig språk.

Lake börjar träna AI-modeller på video istället för stillbilder för att se om de framgångsrikt kan utöka sitt ordförråd till verb och abstrakta ord. Det kommer snart att finnas ytterligare en ström av data att arbeta med, eftersom Lake samlar in data från sin unga dotter.

Men han erkände att sättet att lära sig AI avviker från barns lärande, även för enkla ord. AI:n var riktigt bra på att lära sig att identifiera sand, till exempel, men den kämpade med händerna, vilket innebär att dess framsteg förmodligen inte speglar de flesta barns förståelse för sin miljö.

“'Sand' var för lätt, 'hand' var för hårt,” sa Lake. “Och modellen vet inte att mjölk och päron smakar gott.”

Leave a Reply

Your email address will not be published. Required fields are marked *

Iconic One Theme | Powered by Wordpress