Kan man lita på psykologin?

En uppmärksammad artikel i Science visar att resultaten i färre än hälften av 100 psykologiska experiment gick att upprepa. Modern Psykologi granskar psykologiforskningens trovärdighetsproblem.

Året är 1993. Joakim Westerlund sitter på psykologiska institutionen på Stockholms universitet och känner sig uppgiven. Den akademiska banan har visat sig vara svårare än vad han hittills trott. Hans framtid inom forskarvärlden hänger på att han lyckas hitta någon effekt i sina studier. Det handlar om priming, vilket kortfattat innebär att aktivera omedvetna koncept och därigenom få människor att tänka annorlunda. Joakim Westerlund utgår från tidigare studier och upprepar dem för att se att idéerna verkligen håller. Men trots att priming är ett etablerat begrepp och de tidigare studierna har gett starka resultat, kammar Joakim Westerlund noll. Det finns ingen effekt.
– Fynden gick till och med i motsatt riktning. Vi gjorde flera studier men fann ingenting. Då tror man att man själv varit dålig och gjort fel. Jag var helt knäckt, och undrade vad det skulle bli av med min karriär, berättar han.
I den akademiska världen gäller det att hitta något när man letar. Den som inte får några resultat får inte sina artiklar publicerade. Hur mycket en forskare fått publicera avgör hur lätt det är att söka forskningsanslag i framtiden, och i förlängningen hur attraktiv personen är på arbetsmarknaden.
Karriären tog i stället en annan vändning. En äldre forskare vid institutionen hade fått intressanta forskningsresultat och undrade om Joakim Westerlund var intresserad av att följa upp dem. Forskningen handlade om telepati, som tillsammans med bland annat klärvoajans ingår i området parapsykologi. Det ska sägas att det är ett kontroversiellt ämne som haft svårt att vinna acceptans i forskarvärlden. Kritik har med rätta riktats mot de som grundlöst påstått sig kunna framkalla parapsykologiska fenomen. Men kritiken har också spillt över på forskare som vetenskapligt undersökt om fenomenen existerar eller ej. Joakim Westerlund var skeptisk till telepati men nappade på förslaget att studera det vidare. Han ägnade de följande elva åren åt parapsykologi, innan han gradvis gick över till andra forskningsområden och undervisning i vetenskaplig metodik.
Där gav de elva åren honom en fördel: han hade blivit extra noggrann i sin forskning. När han undersökte paranormala fenomen fanns ständigt vetskapen om vilket enormt tvivel positiva fynd skulle mötas av. Om han mot förmodan skulle ha hittat något kunde minsta fel i forskningsupplägget göra att allting viftades bort och allt arbete vara förgäves.
– Det gjorde att jag bättre kunde förstå hur problematisk vetenskapen kan vara, berättar han.
År 2011 publicerades en artikel som skulle röra om den psykologiska forskningen ordentligt. Den var skriven av den respekterade psykologen Daryl Bem och publicerad i Journal of personality and social psychology, en av psykologins tyngsta tidskrifter. Studien bestod av nio experiment, med sammanlagt nära tusen deltagare. Det som undersöktes var välkända psykologiska mekanismer, men med en betydelsefull skillnad. Processerna ägde rum i bakvänd ordning. Det som mättes var förmågan att skåda in i framtiden. I ett av de mer pikanta delexperimenten visade sig deltagarna bli upphetsade av erotiska bilder på en skärm, trots att bilderna ännu inte visats. I ett annat delexperiment hade de lättare att minnas ord som de skulle träna på först efter testningen. Hela åtta av nio delexperiment gav stöd för att människor kan se in i framtiden. Det märkligaste var att allting verkade vara välgjort: Deltagarna var tillräckligt många för att det skulle gå att dra slutsatser. De hade hela tiden varit ensamma i rummet så att ingen av forskarna omedvetet påverkade dem. Men trots noggrannheten hade de flesta oerhört svårt att svälja fynden.
Låt säga att vi människor faktiskt har en förmåga att skåda in i framtiden. En sådan egenskap skulle tala emot allt vi känner till om världen: om fysikens lagar, om tidens linjära natur, om vår egen biologi. Det vore, kort sagt, oerhört konstigt. Det måste finnas en annan förklaring, en mindre konstig sådan. Tre olika forskargrupper föresatte sig att undersöka saken. De skulle själva utföra experimenten i vad de kallade för Daryl Bems ”extremt tankeväckande” artikel, vilket är ett artigt sätt att säga att någonting var lurt.
En central del i vetenskapen, åtminstone den del som lite krångligt kallas för den hypotetisk-deduktiva metoden, är replikering. Rent praktiskt går kunskapsinhämtningen till ungefär så här: En forskare har en hypotes, exempelvis att det är lättare att minnas ord man i framtiden kommer att träna på. För att undersöka om det stämmer görs systematiska observationer, i det här fallet genom ett experiment. Ett enstaka resultat i en ensam studie gör i akademisk mening ingen skillnad. För att effekten ska räknas som verklig måste den först visa sig gång på gång i olika sammanhang: med andra deltagare, miljöer och inte minst forskare. Det vetenskapliga bygget utgörs inte av pråliga ornament, utan av noggrant utvalda och omsorgsfullt infogade stenar, nerifrån och upp.
Experimenten som skulle replikera Daryl Bems studie innehöll ännu fler deltagare än originalstudien, och planerades med ännu större stringens. Den här gången blev resultaten inte lika fantasieggande. Deltagarna betedde sig precis som det kan förväntas om de agerar slumpmässigt. De kunde inte se in i framtiden.
Vad var det som hade hänt? Om vi människor inte är utrustade med ett slags sjätte sinne, hur kunde Daryl Bem hitta ett så starkt vetenskapligt stöd för det? Eller: Vad är den mindre konstiga förklaringen?
– Det handlar om småfuskandet. Det som inte uppfattas som fusk. Vår hjärna är en mönsterskapande maskin, och utan att det är medvetet hittar vi alltid data som stöder vår teori, säger Joakim Westerlund.
Det var precis vad som hänt i Daryl Bems studie. Inte avsiktligt lurendrejeri, utan små saker som tillsammans ökade sannolikheten för att finna en effekt som i själva verket inte fanns. I några delexperiment misslyckades gruppen som helhet att skåda in i framtiden. Det fanns däremot vissa det gick bättre för. De deltagare som var ”känsliga för uttråkning”, ett väldigt ovanligt mått i de här sammanhangen, hade större framgång. Mycket talade för att kategoriseringen tagits fram som en stundens ingivelse i stället för att planeras i förväg, något som kraftigt ökar sannolikheten för att råka hitta en effekt som inte finns.
– Om man i efterhand delar upp deltagarna har man frångått hypotesprövningen. Man kan kategorisera efter kön, personlighet, vilken tid på dagen de testas och så vidare. Om man håller på så här får man till slut alltid resultat, berättar Joakim Westerlund.
Ett av de granskande forskarlagen gjorde en annan besvärande upptäckt. De delexperiment som påvisat starkast effekt var genomgående de som innehöll minst antal deltagare. En slump? Förmodligen inte. Tänk dig att du varje kväll sätter dig vid ett roulettebord för att spela. Du satsar en hundralapp åt gången, alltid på svart. Efter en hel kväll kommer du sannolikt att ha gått jämnt ut (vi tänker bort ”nollan” som vare sig är röd eller svart). Däremot kan du ha tur. Det är inte alls omöjligt att de tre eller fyra första kulorna landar på svart. Om du i det läget lämnar bordet kan du stolt berätta för dina vänner att du minsann gått plus på spelandet. Trots att sannolikheten för att kulan hamnar på svart är 50 procent, kan du alltså få enstaka spelserier som är bättre än slumpen. Motsvarigheten i ett vetenskapligt experiment är att hålla ett öga på resultaten i takt med att de ramlar in. Genom att veta vilka av dem som visar på en effekt kan man helt enkelt nöja sig när siffrorna ser bra ut och avsluta datainsamlingen.
Nu när det visat sig att de fantastiska effekterna i Daryl Bems studie inte höll, samtidigt som det fanns förklaringar till hur de kunnat uppstå, är det lätt att tro att det hela skulle vara över. Om allt gått som det skulle hade de nya artiklarna publicerats och lästs av andra forskare, som i sin tur kunnat dra sina slutsatser.
Men informationen kom inte så långt. Ingen av forskargrupperna fick nämligen sina resultat publicerade. Journal of personality and social psychology, tidskriften som glatt accepterat Daryl Bems studie, hade som princip att inte publicera upprepningar av tidigare experiment, oavsett hur långsökta ursprungsresultaten var.
Den här hållningen kan tyckas märklig, men är inte ovanlig. Faktum är att så få som en futtig procent av publicerade psykologiartiklar är upprepningar av tidigare experiment. I slutänden handlar det om ekonomiska incitament. Medan kvällstidningar jagar lösnummerförsäljning och morgontidningar prenumeranter, finns det en annan siffra som räknas för vetenskapliga tidskrifter: hur många gånger deras artiklar citeras. Uppseendeväckande resultat blir en snackis, vilket leder till att andra forskare nämner resultaten i sina egna studier. Att kunna stoltsera med många citeringar är ett starkt marknadsföringsargument för en tidskrift. Därför blir det mer av nya, sexiga och inte sällan motsägelsefulla fynd och mindre av det långsamma pusslandet. De små stenarna i vetenskapsbyggets grund blir ofta utvalda för att de glittrar fint snarare än för att de är särskilt bra att bygga på.
Eftersom forskarna vet om att det är i det närmaste omöjligt att publicera studier som inte gett något resultat läggs de undan och glöms bort. Det så kallade byrålådsproblemet har den trista konsekvensen att obalansen dessutom bevaras. Ett av vetenskapens mest kraftfulla vapen heter metaanalyser, alltså systematiska sammanställningar av studier som redan gjorts. En sådan genomgång samlar ihop studier från olika tider och platser, och är därför ett utmärkt sätt att få svar på en vetenskaplig frågeställning. Åtminstone i teorin. Problemet är att urvalet är skevt: en av anledningarna till att de studier som metaanalysen jämför ens finns i tidskrifterna är att de uppvisar positiva resultat.
– En student som gör en liten studie utan att hitta resultat skriver ihop en uppsats som aldrig kommer att bli publicerad, blir godkänd på kursen och resultatet glöms bort. Men om studenten får ett positivt resultat kommer handledaren att rekommendera att man går vidare och försöker få studien publicerad, säger Joakim Westerlund.
Problemen med överdrivet positiva fynd är stort. Som en fingervisning hittar psyko­logiforskare stöd för sin hypotes i fler än nio av tio publicerade studier. Det är högst av alla vetenskapsområden.
– Vi tillhör de värsta vetenskaperna. Hypoteserna bekräftas osannolikt ofta, säger Gerhard Andersson, psykolog och professor vid bland annat Linköpings universitet, med över 400 vetenskapliga artiklar innanför bältet.
Den felaktiga bilden av kunskapsläget kan i sin tur driva forskare till att lägga ännu mer vikt vid att hitta stöd för sina hypoteser. Det är lätt att tänka sig att alla andra har lyckats. Joakim Westerlund minns sina första stapplande steg på den akademiska banan: primingexperimenten som aldrig gav några resultat.
– När man är i situationen försöker man bortförklara varför man inte hittar något, men sanningen kanske är att effekten helt enkelt inte finns. Man ser ju bara toppen av ett isberg, nämligen de artiklar där man faktiskt hittat någonting. Det gör att man lurar sig själv. Hypotesen bekräftas inte, men vi ska inte ge upp. Så vi tittar på våra data en gång till och undersöker dem på ett annat sätt, berättar han.
Eftersom paranormala förmågor är ett så kontroversiellt fenomen blev tanken på att Daryl Bems studie skulle stå oemotsagd för mycket för många forskare. Efter en hätsk debatt ändrade sig till slut tidskriften och publicerade en av replikeringsartiklarna. Ordningen var återställd, men oroliga röster började höras. Många forskare medgav motvilligt att de synder som upptäckts i Daryl Bems studie inte var helt ovanliga, och tidskrifterna hade ju bara gjort som vanligt. Fanns det andra ”sanningar” som stod på ett lika svajigt fundament, och skulle de i så fall avslöjas?
För att förstå vad som sedan hände måste vi återigen rikta blicken mot priming. Grundprincipen i begreppet är att någonting vi sett eller hört kan påverka oss, utan att vi för tillfället tänker på det. Om någon ombeds bilda ett ord genom att lägga till en bokstav efter H och U, går det för en utomstående att påverka vilket ord det blir genom att prima personen. De som dessförinnan fått se orden ”gata”, ”hem” och ”tak” kommer sannolikt att fylla i en annan avslutande bokstav än dem som fått se ”sola”, ”kropp” och ”tunn”. Koncepten ”hus” respektive ”hud” har aktiverats av de närliggande orden, vilket skapar ett slags tillfällig snabbkoppling till dem. Det låter kanske inte så konstigt. Men år 1996 gjordes ett experiment som hittade en mer långtgående effekt.
John Bargh, socialpsykolog och forskare vid New York-universitetet, var nyfiken på om primingeffekten inte bara kunde påverka vad vi kom att tänka på, utan även hur vi betedde oss. Han lät deltagare pyssla med ett ordknåp, där han stoppat in ord som påminde om åldrande, till exempel ”gammal”, ”bingo” och ”rynka”. I själva verket struntade John Bargh blankt i hur duktiga deltagarna var på att lösa uppgifterna. Det som egentligen mättes var hur lång tid de tog på sig för att gå till den andra änden av korridoren efteråt. Effekten var tydlig: de som fått se ord som hade med åldringar att göra gick långsammare än dem som arbetat med neutrala ord. Förklaringen var, enligt teorin om priming, att orden aktiverat stereotypa bilder av äldre, vilket på ett undermedvetet plan fått deltagarna att bete sig som stereotypen.
Fyndet gick emot mycket av det vi trodde oss veta om mänskligt beteende, och artikeln fick ett gigantiskt genomslag. Den citerades tusentals gånger de följande åren, och i både läroböcker och det allmänna medvetandet blev ”social priming” snabbt en vedertagen sanning. Studie efter studie, den ena mer uppseendeväckande än den andra, demonstrerade priming­effekten i andra sammanhang. Den som gör ett kunskapstest blir smartare av att omedvetet primas med bilden av en klyftig professor än av en korkad fotbollshuligan. En varm kaffekopp i handen gör att vi omedvetet bedömer främlingar som varmare personer. Om det går att påverka hur vi bedömer andra utan att vi märker det, varför då inte oss själva? Fantastiska nya terapiformer låg alldeles runt hörnet. Det var bara ett problem: resultaten var kraftigt överdrivna.
– Barghs studie om social priming är väl exempel på när något är för bra för att vara sant, säger Gerhard Andersson.
Vad var det som hade hänt? Ja, egentligen samma sak som i Bem-skandalen. Många av de primingstudier som gett resultat hade slunkit igenom med samma sorts småfel som Daryl Bems artikel, samtidigt som de resultatlösa studierna stuvats undan i byrålådor. Men den här gången gick det att kika in i dem. Det blev på modet att replikera primingstudier och uppskattat att inte hitta någon effekt. Debatten var smärtsam för flera av de inblandade, inte minst för de forskare som med ärligt uppsåt hittat stöd för social priming och nu anklagades för fusk. Men kanske var diskussionerna det stålbad som den psykologiska forskningen behövde. Efter allt högre krav har det blivit vanligare att studier registreras i förväg för att de inte ska stoppas undan om de inte ger resultat. Men vart ska de ta vägen? Även om forskarna själva är öppna med att de inte hittat något finns ju de vetenskapliga tidskrifternas flaskhals kvar. Också här finns det ljusningar. Tidskrifterna upplåter oftare plats åt replikeringsstudier, oavsett om de gett resultat eller inte. Det har även blivit vanligare att publicera i onlinetidskrifter, som tack vare att de inte behöver tänka på utrymme i pappersupplagan kan ta in alla artiklar som håller tillräcklig kvalitet.
Samtidigt har flera initiativ dragits igång för att göra fältet mindre beroende av tidskrifternas ansvar. I databasen Psychfiledrawer går det att offentliggöra studier som annars aldrig sett dagens ljus. Ett annat initiativ, The reproducibility project, omfattar 250 psykologiforskare som föresatt sig att replikera sammanlagt 100 studier från ett visst nummer av de tre största tidskrifterna. Tanken med utsnittet är att få en bild av hur vetenskapsbygget står sig. I maj kom det preliminära svaret: mindre än hälften av resultaten gick att upprepa (Uppdatering: I augusti bekräftades det resultatet i tidskriften Science).
– Vi måste framför allt göra så att det lönar sig att berätta om de gånger man inte hittar resultat. Det går inte att nog betona hur viktigt det är, sammanfattar Gerhard Andersson förändringarna.
I sin metodundervisning på universitetet använder Joakim Westerlund ofta Daryl Bems och John Barghs studier som pedagogiska exempel. Hans bild är att allt fler psykologiforskare får upp ögonen för forskningens problem. Det rör sig åt rätt håll.
– Alla åtgärder har inte slagit igenom än, men det kommer. Byrålådsproblemet är en lång process att bli av med, men det sker ett medvetandegörande och en gradvis förbättring. Jag är absolut positiv, säger han.

Text: