
Så uppstod det mänskliga språket
Arkeologen Jonathan Lindström djupdyker i hur språkets utveckling har drivits på av eld, käkar – och småbarn.
Har du hört talas om ding-dong, yo-he-ho och pooh-pooh? Det är benämningar på tidiga teorier för hur det mänskliga språket en gång uppstod, numera betraktade som naiva. I gengäld är nutida teorier ofta förvirrande krångliga.
orsak kan vara att de är lappverk av gammalt och nytt, där de grundläggande orsakerna till språkets uppkomst skyms.
För några år sedan gjorde lingvisten Tore Janson ett övertygande försök att fokusera på väsentligheterna i sin bok ”Språken före historien.” Till att börja med lyfter Janson fram språkets viktigaste funktion: det används för att överföra information som ökar möjligheten till överlevnad. Det mänskliga språket är så unikt och avancerat att det har krävt en lång tids utveckling från ett ursprungsstadium. Det kan inte ha uppstått genom slumpmässiga, plötsliga och omfattande fysiologiska förändringar i hjärnan och talapparaten. Under hela sin utvecklingshistoria måste språket ha haft evolutionära fördelar. Språket utvecklas intensivt i början av livet, och det är därför troligt att det var småbarnen som drev utvecklingen framåt, genom att överlevnaden ökade drastiskt för de barn som kunde ljuda och kommunicera med människorna i sin omgivning. Och så en självklarhet: språket är i första hand ljud, om än stöttat av tecken, gester och grimaser. Söker vi språkets ursprung bör vi därför utgå från de ljudsignaler som schimpanser och andra stora apor använder i sin kommunikation.
Tore Janson menar att utvecklingen kan ha varit mycket utsträckt i tid. Den kan ha börjat när homininerna, människornas direkta förmödrar, skiljde ut sig från schimpanserna för fem, sex miljoner år sedan. Janson visar att språkförmågan var fullt utvecklad för 300 000 år sedan i Afrika. Utvecklingen går att följa genom att jämföra med den tidiga människans historia, som vi känner den från arkeologin. Men först besöker vi nutidens schimpanser för att förstå vad evolutionen en gång hade att utgå ifrån.
Schimpansiskans brister
Schimpanser i fångenskap har lärt sig teckenspråk, motsvarande ungefär hundrafemtio ord, där de kan reflektera över tidigare händelser och i vissa fall skapa nya metaforiska betydelser. Men det återspeglar egentligen bara människoaphjärnans yttersta kapacitet under extrema inlärningsförhållanden. De djur vi träffar i fångenskap är ett slags akademiker-schimpanser, tränade i en disciplin som inte duger mycket till på den tropiska regnskogens arbetsmarknad. Istället bör vi uppmärksamma hur schimpanserna skiljer sig från oss. Schimpansens inlärningsförmåga och utveckling påminner om människans upp till två års ålder. Sedan stelnar schimpansen till en vuxen individ, innan något som liknar mänskligt språk formas.
Vi kan räkna med att detta var den blygsamma utgångsnivån för de första homininerna, som klättrade ner ur träden, reste sig och vandrade ut på savannen. Fossil och fynd talar för att de i och med detta blev allt mer intelligenta och sociala varelser. Därmed kan utvecklingen mot språkförmågan ha tagit sin början.
Utifrån jämförelser med de stora aporna menar Janson att de tidigaste homininerna hade en väl utvecklad förmåga att läsa av och lyssna till omgivningen och kunde tolka andras ljudsignaler. Sammanlagt fanns mellan femton och tjugo ljudsignaler, avsedda att förmedla uppmaningar, exempelvis ”se upp för fara” och ”var snäll mot mig, du som är högre i rang”. Skratt, gråt och skrik ingick och de olika ljudsignalerna användes flexibelt. Homininerna lärde normalt inte in nya signaler, men enligt Janson fanns det ändå ett litet utrymme för detta som evolutionen kunde greppa tag i, exempelvis genom att variera en medfödd signal.
”Utvecklingen kan
långsamt ha börjat redan för fem miljoner år sedan”
Mamma
De tidiga homininerna utvecklade förmågan att bruka några tiotal inlärda ljudsignaler med valfri innebörd, fler än de medfödda signalerna. Att ljudsignalens innebörd var flexibel hade ett stort överlevnadsvärde eftersom man då kunde anpassa sig till förändrade yttre villkor. Detta kom till nytta hemma i lägret. Bland homininernas förmödrar hade ungarna tytt sig nästan helt till sin mor, men i takt med att kollektivets och faderns betydelse ökade kom ungarna att få flera äldre kring sig som engagerade sig i omvårdnad och matning. Den unge som kunde göra riktade tilltal, som ”mamma!”, hade betydligt större chans att överleva. Även egennamn kan ha uppstått mycket tidigt. Det innebar att den medfödda förmågan att uttrycka nya ljudsignaler och att lära sig fler olika innebörder förbättrades med tiden. Allteftersom lärdes signaler för olika sorters mat, djur och växter.
Utvecklingen kan långsamt ha börjat redan för fem miljoner år sedan, men skymtar arkeologiskt först för två miljoner år sedan. Skallvolymen ökade och redskapstillverkning avancerade, vilket bland annat underlättade styckande och ätandet. Det senare avlastade käken och gav visst utrymme för fysiologiska förbättringar av ljudframställningen. En antydan om inlärda ljudsignaler ger Homo erectus expansion ut från Afrika vid denna tid. Det visar på en förmåga att anpassa sig till nya miljöer, med andra faror och födor, vilket är lättare att hantera om man inte är bunden till enbart nedärvda ljudsignaler utan kan lära in nya betydelser.
Homo erectus förmåga till språk fortsatte att utvecklas. Sakta ökade möjligheten att producera inlärda signaler för att få till ljudbilder som alltmer liknade ord, där ljuden blev alltmer distinkta och kunde uttalas i allt högre hastighet och närmade sig våra språkljud. Nu började uppmaningarna som ”Kom hit!” och egennamnen som ”Mamma!” så sakteliga få sällskap av påståenden ”Mamma.” och frågor ”Mamma?” Ett namn för varje individ i gruppen innebar några tiotal ord, likaså benämningar på mat, djur, växter och platser som vattenhål och läger. Med tiden blev det hundratals ord. Orden brukades mestadels separat.
Språkförmågan växte långsamt, fysiologiska förändringar måste till. Med varje nytt ljudtillskott ökade möjligheterna exponentiellt. Som bekant brukar en exponentiell kurva börja svagt sluttande och till slut skjuta brant i höjden, det Janson kallar ketchupeffekten, då mer eller mindre plötsligt många hundratals ljudbilder och ord blir möjliga att framställa, ge en inlärd betydelse och meddela sig med. Detta innebar att en ny fas inleddes.
Lägereld och lagad mat
När inföll denna ketchupeffekt? Kanske med början för 750 000 till 500 000 år sedan, med sena Homo erectus eller hellre Homo heidelbergensis, då skallvolymen ökade och stenredskapen förfinades ytterligare. Särskilt intressant är att det är nu som vi också får pålitliga exempel på att människor började utnyttja elden, inte minst för matlagning. Eldbruket dyker tidigt upp och blev helt etablerat för minst 400 000 år sedan.
Särskilt intressant är att matlagningskonsten öppnade upp för stora förändringar. Genom beredningen blev det lättare att ta upp energin från födan, vilket tillät en effektivare men mer energislukande hjärna. Hjärnan hos moderna människor utgör bara en femtiondel av vikten men gör av med en femtedel av energin. Tillagad mat, både kött och sega växtdelar, ställde lägre krav på käkarnas styrka och strupens utformning. Det gav utrymme för talorganet att utvecklas. När hundratals ljudbilder och ord skulle hanteras och uttalas både distinkt och snabbt räckte det inte med att modifiera medfödda ljudsignaler. Nu kunde evolutionen mejsla vidare på både hjärnan och talorganet. Matlagningen innebar att det selektiva trycket även fortsatt låg på de små barnen. Avvänjningen från amningen kunde påbörjas tidigare och barnen fick allt större skäl att tigga mat, vilket innebar ett intensivt intresse att kommunicera övertygande med äldre i sin omgivning flera gånger om dagen.
Eldbruket innebar också att lägerplatsen blev mer än en enkel övernattningsplats. Eldstaden var ett centrum att samlas kring, inte bara för matlagning och måltider. Elden gav ljus och värme under kvällar och nätter, men de extra timmarna kunde inte ägnas åt jakt eller insamling utan måste tillbringas sittande vid elden med handarbete och möjlighet till umgänge med tal och sång. Småbarn måste passas dygnet runt, inte minst från elden. Allt detta kan ha lett till att kvinnokollektiv uppstod av det slag som fanns hos historiska jägarfolk. Kvinnorna hjälpte varandra med barnpassning, amning, matlagning, andra hantverk, insamling, jakt, vedinsamling och vattenhämtning. Barnen fick från första stund växa upp i en social miljö av oavbrutet kommunicerande människor.

I denna miljö kan de fysiologiska förändringarna av talorganet ha kulminerat. Lagad mat istället för rå och seg föda innebar att ett framskjutet käkparti med kraftig tuggapparat kunde tillbakabildas. Utrymme gavs för ett talorgan där tänder, gom, strupe, tunga, läppar och stämband blev ett flerdimensionellt instrument för framställning av en enorm mängd olika ljud. Nackdelen var att vi till skillnad från de stora aporna måste hålla andan när vi sväljer och vi riskerar att sätta i vrångstupen, men den ökade risken är försumbar i jämförelse med de fördelar språket ger.
Parallellt utvecklades motoriska nerver och delar av hjärnan till en speleman som kunde traktera instrumentet med tydliga ljud i allt snabbare takt. På så sätt övergavs de gamla fåtaliga ljudsignalerna och ersattes av ett system som kunde leverera stora mängder information på kort tid.
Först för omkring 330 000 år sedan i Afrika utvecklades den moderna människan, vilket framgår av skelettfynd och genetiska studier samt en tydlig förändring i kulturen, daterbar till omkring 330 000 år sedan. Språknivån dessförinnan var inte lika långt gången. Neandertalarna, som avskildes från vår afrikanska släktlinje senast för omkring 400 000 år sedan, nådde inte att döma av sina arkeologiska lämningar upp till den moderna människans nivå. Kanske inskränkte sig språket till enstaka ord och enklare ordkombinationer.
Nu snackar vi
Tore Janson beskriver det avgörande steget i språkutvecklingen som förmågan att forma meningar. Med enordsyttranden kan man komma långt. Om lyssnarna vill veta var Emil är, kan det räcka med att säga ”dricka” för att de ska förstå att han är vid vattenkällan. Om de inte har noterat Emils frånvaro kan två ord ”Emil” och ”dricka” med lite eftertanke få dem att förstå vart han har tagit vägen.
En svårighet med tvåordsmeddelanden är att få lyssnaren att förstå att de två orden ska tolkas tillsammans. Detta kan underlättas antingen genom att man säger orden så tätt inpå varandra som möjligt, helst utan paus, eller genom att förkorta ett av orden till ett enkelt läte som hakas på det andra ordet. Det kan låta enkelt men barn måste anstränga sig för att få ihop sina första tvåordsyttranden, även om de når den färdigheten före tre års ålder. Janson påpekar att för att det hela ska fungera rent neurologiskt bör hela yttrandet vara planerat redan när talaren öppnar munnen.
Det krävs därmed en del evolutionär utveckling för att förmågan ska uppkomma, och därmed uppstår det fantastiska att påståenden med minst två ord gav talaren möjlighet att låta lyssnaren ta del av något som låg utanför det som syns och hörs, bortom här och nu. Två ord blir inte bara en mening utan en liten berättelse.
Tore Janson konstaterar: Den stora vinsten med att säga en mening är alltså att kunna öppna en ny scen. Därmed skapas möjligheter att tala om allt som finns, och för den som vill och vågar också om sådant som inte finns.
Sedan 330 000 år har språket och berättandet varit människan till hjälp att uppfostra sina barn och hjälpa dem att överleva i en ständigt föränderlig värld.
Jonathan Lindström är arkeolog och författare. Han är aktuell med boken ”Världens äldsta historia” (Norstedts).
***
Läs även: I huvudet på en neurokirurg
Läs även: När utseendet är allt