IT og digitalisering
Sammenhængen mellem Nicolas Cage og drukneulykker
Hvad er falske korrelationer?
Inden for statistik er en falsk korrelation et matematisk forhold, hvor to eller flere begivenheder eller variabler ser ud til at være forbundet – men ikke er årsagsrelaterede. Det sker enten ved ren tilfældighed eller fordi der findes en tredje, skjult faktor.
Et klassisk eksempel er, at når der sælges meget is, er der også flere drukneulykker. Drukner folk, fordi de spiser for meget is? Næppe. Det gode vejr lokker både til is og badning – og det er netop den usynlige tredje faktor, der skaber illusionen af en sammenhæng.
Amerikanske Tyler Vigen har samlet en række falske korrelationer, som er ret underholdende at dykke ned i.
Fx er der tilsyneladende en korrelation mellem antal af film med Nicolas Cage fra 1999 og 2009, og hvor mange folk der er druknet i swimming pools i samme periode.
En anden smuk men falsk sammenhæng er forbruget af ost og antal af personer, der dør ved at blive viklet ind i deres sengetøj.
I disse eksempler er korrelationerne tydeligvis langt ude, men i professionelle sammenhænge kan det være sværere at få øje på, om der er tale om tilfældige sammenfald eller ægte korrelationer - og det kan være farligt.
Og jo større din datamængde, desto større er risikoen for, at der dukker besnærende men falske sammenhænge op.
Apofeni: Hjernen elsker mønstre
Menneskehjernen er evolutionært designet til at opdage mønstre. Det har haft enorm overlevelsesværdi at kunne se sammenhænge – mellem fodspor og rovdyr, mørke skyer og regn, eller lyde og fare.
Det betyder, at vi ubevidst leder efter mening i selv de mest tilfældige data. Vores hjerne får en lille dopamin-belønning, når vi finder et mønster, der “giver mening”, og derfor føles det intuitivt rigtigt – også selvom det er forkert.
Fænomenet kaldes apofeni – tendensen til at se forbindelser, der ikke eksisterer. I dataverdenen kan det føre til overfortolkning, hvor analytikere og beslutningstagere begynder at drage konklusioner ud fra tilfældige sammenfald.
Så hvis dine data viser korrelationer, der kommer helt bag på dig, kan det være, at du ikke kender dine kunder, dit marked etc så godt som du troede.
Men inden du laver om på hele din virksomhed kan det være værd at tjekke, om der er en usynlig, tredje faktor på spil, eller om der er tale om et simpelt tilfælde - inden du pludselig får skabt dig et meget misvisende billede af virkeligheden.
Sådan spotter du falske korrelationer
1. Kig efter årsagen – ikke bare mønsteret.
Hvis du ikke kan forklare hvorfor A påvirker B, er der sandsynligvis ikke tale om en reel sammenhæng.
2. Tjek for en tredje faktor.
Mange korrelationer skyldes en skjult fællesnævner – fx årstid, geografi eller demografi.
3. Test det over tid.
Ægte sammenhænge er stabile. Forsvinder mønsteret, når du tilføjer mere data, var det nok bare tilfældigt.
Læs mere:
Kontakt
Få hjælp nu
Find relevante, kvalitetssikrede kurser og efteruddannelse.