Korrelaatio ei tarkoita kausaalisuutta

heinä 16, 2021
admin

B aiheuttaa A:n (käänteinen kausaalisuus tai käänteinen kausaalisuus)Edit

Käänteinen kausaalisuus tai käänteinen kausaalisuus tai väärä suunta on epävirallinen kyseenalaistetun syyn harhaluulo, jossa syy ja seuraus käännetään toisin päin. Syyn sanotaan olevan vaikutus ja päinvastoin.

Esimerkki 1 Mitä nopeammin tuulimyllyjen havaitaan pyörivän, sitä enemmän tuulta havaitaan. Tuuli johtuu siis tuulimyllyjen pyörimisestä. (Tai yksinkertaisesti sanottuna: tuulimyllyt ovat nimensä mukaisesti koneita, joita käytetään tuulen tuottamiseen).

Tässä esimerkissä tuulimyllyjen toiminnan ja tuulen nopeuden välinen korrelaatio (samanaikaisuus) ei tarkoita, että tuuli johtuu tuulimyllyistä. Se on pikemminkin päinvastoin, kuten viittaa se, että tuuli ei tarvitse tuulimyllyjä ollakseen olemassa, kun taas tuulimyllyt tarvitsevat tuulta pyöriäkseen. Tuulta voidaan havaita paikoissa, joissa ei ole tuulimyllyjä tai joissa ei ole pyöriviä tuulimyllyjä – ja on hyviä syitä uskoa, että tuuli oli olemassa jo ennen tuulimyllyjen keksimistä.

Esimerkki 2

Toisissa tapauksissa voi yksinkertaisesti olla epäselvää, mikä on syy ja mikä on seuraus. Esimerkiksi:

Lapset, jotka katsovat paljon televisiota, ovat kaikkein väkivaltaisimpia. On selvää, että televisio tekee lapsista väkivaltaisempia.

Tämä voisi helposti olla myös toisinpäin; eli väkivaltaiset lapset tykkäävät katsoa enemmän televisiota kuin vähemmän väkivaltaiset.

Esimerkki 3

Vapaa-ajan huumeidenkäytön ja psykiatristen häiriöiden välinen korrelaatio voi olla kummin päin tahansa: ehkä huumeet aiheuttavat häiriöt, tai ehkä ihmiset käyttävät huumeita itsehoitona jo olemassa oleviin sairauksiin. Porttihuumeteoria voi väittää, että marihuanan käyttö johtaa kovempien huumeiden käyttöön, mutta kovien huumeiden käyttö voi johtaa marihuanan käyttöön (ks. myös käänteisen sekaannus). Yhteiskuntatieteissä, joissa valvottuja kokeita ei useinkaan voida käyttää syy-yhteyden suunnan selvittämiseen, tämä harhaluulo voi ruokkia pitkäaikaisia tieteellisiä väitteitä. Yksi tällainen esimerkki löytyy koulutustaloustieteestä, seulonta/signalointi- ja inhimillisen pääoman mallien väliltä: voi olla joko niin, että synnynnäinen kyvykkyys mahdollistaa koulutuksen suorittamisen, tai niin, että koulutuksen suorittaminen kasvattaa kyvykkyyttä.

Esimerkki 4

Historiallinen esimerkki tästä on se, että keskiajan eurooppalaiset uskoivat, että täit olivat terveydelle edullisia, koska sairailla ihmisillä oli harvoin täitä. Perusteluna oli, että ihmiset sairastuivat, koska täit lähtivät pois. Todellinen syy on kuitenkin se, että täit ovat erittäin herkkiä kehon lämpötilalle. Pienikin ruumiinlämmön nousu, kuten kuume, saa täit etsimään toisen isännän. Lääketieteellistä lämpömittaria ei ollut vielä keksitty, joten tällaista lämpötilan nousua huomattiin harvoin. Huomattavat oireet tulivat myöhemmin, mikä antoi vaikutelman, että täit lähtivät ennen kuin henkilö sairastui.

Toisissa tapauksissa kaksi ilmiötä voi olla kumpikin osasyynä toiselle; ajatellaan esimerkiksi köyhyyttä ja koulutuksen puutetta tai viivyttelyä ja huonoa itsetuntoa. Sen, joka esittää väitteen näiden kahden ilmiön perusteella, on kuitenkin oltava varovainen välttääkseen ympäripyöreän syyn ja seurauksen harhaa. Köyhyys on koulutuksen puutteen syy, mutta se ei ole ainoa syy, ja päinvastoin.

Kolmas tekijä C (yhteissyyllinen muuttuja) aiheuttaa sekä A:n että BEdit

Pääartikkeli: Epäaito suhde

Kolmannen syyn harhaluulo (tunnetaan myös nimellä yhteisen syyn huomiotta jättäminen tai kyseenalainen syy) on looginen harhaluulo, jossa epäaito suhde sekoitetaan syy-yhteyteen. Siinä väitetään, että X aiheuttaa Y:n, vaikka todellisuudessa X ja Y ovat molemmat Z:n aiheuttamia. Se on muunnelma post hoc ergo propter hoc -harhaluulosta ja kuuluu kyseenalaisten syiden harhaluulojen ryhmään.

Kaikki nämä esimerkit käsittelevät piilevää muuttujaa (lurking variable), joka on yksinkertaisesti piilossa oleva kolmas muuttuja, joka vaikuttaa molempiin korrelaation syihin. Vaikeus syntyy usein myös silloin, kun kolmas tekijä, vaikka se eroaa olennaisesti A:sta ja B:stä, liittyy niin läheisesti A:han ja/tai B:hen, että se sekoitetaan niihin tai sitä on hyvin vaikea tieteellisesti erottaa niistä (ks. esimerkki 4).

Esimerkki 1 Kengät jalassa nukkuminen korreloi vahvasti päänsärkyyn heräämisen kanssa. Siksi kengät jalassa nukkuminen aiheuttaa päänsärkyä.

Yllä oleva esimerkki syyllistyy korrelaatio-epäselvyys-epäselvyysvirheeseen, sillä se päättelee ennenaikaisesti, että kengät jalassa nukkuminen aiheuttaa päänsärkyä. Uskottavampi selitys on, että molemmat johtuvat kolmannesta tekijästä, tässä tapauksessa humalassa nukkumaanmenosta, joka siten synnyttää korrelaation. Johtopäätös on siis väärä.

Esimerkki 2 Pienet lapset, jotka nukkuvat valot päällä, sairastuvat paljon todennäköisemmin likinäköisyyteen myöhemmällä iällä. Siksi valon ollessa päällä nukkuminen aiheuttaa likinäköisyyttä.

Tämä on tieteellinen esimerkki, joka syntyi Pennsylvanian yliopiston lääketieteellisessä keskuksessa tehdyn tutkimuksen tuloksena. Tutkimus julkaistiin Nature-lehden 13. toukokuuta 1999 ilmestyneessä numerossa, ja se sai aikanaan paljon huomiota populaarilehdistössä. Myöhemmässä Ohio State Universityssä tehdyssä tutkimuksessa ei kuitenkaan havaittu, että valon ollessa päällä nukkuvat pikkulapset olisivat aiheuttaneet likinäköisyyden kehittymistä. Tutkimuksessa havaittiin kuitenkin vahva yhteys vanhempien likinäköisyyden ja lasten likinäköisyyden kehittymisen välillä ja todettiin myös, että likinäköiset vanhemmat jättivät todennäköisemmin valon päälle lastensa makuuhuoneeseen. Tässä tapauksessa molempien tilojen syy on vanhempien likinäköisyys, ja edellä esitetty johtopäätös on väärä.

Esimerkki 3 Jäätelön myynnin kasvaessa hukkumiskuolemien määrä kasvaa jyrkästi. Siksi jäätelön kulutus aiheuttaa hukkumiskuolemia.

Tässä esimerkissä ei huomioida vuodenajan ja lämpötilan merkitystä jäätelön myyntiin. Jäätelöä myydään kuumina kesäkuukausina paljon enemmän kuin kylmempinä aikoina, ja juuri kuumina kesäkuukausina ihmiset harrastavat todennäköisemmin veteen liittyviä aktiviteetteja, kuten uintia. Lisääntyneet hukkumiskuolemat johtuvat yksinkertaisesti suuremmasta altistumisesta vesipohjaisille aktiviteeteille, ei jäätelöstä. Esitetty johtopäätös on väärä.

Esimerkki 4 Hypoteettinen tutkimus osoittaa, että koepelkoarvojen ja ujousarvojen välillä on yhteys, jonka tilastollinen r-arvo (korrelaation voimakkuus) on +,59. Näin ollen voidaan yksinkertaisesti päätellä, että ujous vaikuttaa jossakin määrin kausaalisesti koepelkoisuuteen.

Mutta kuten monissa psykologisissa tutkimuksissa havaitaan, löydetään toinen muuttuja, ”itsetietoisuuspistemäärä”, jolla on jyrkempi korrelaatio (+.73) ujouden kanssa. Tämä viittaa mahdolliseen ”kolmannen muuttujan” ongelmaan, mutta kun löydetään kolme näin läheisesti toisiinsa liittyvää mittaria, se viittaa lisäksi siihen, että kullakin niistä voi olla kaksisuuntaisia taipumuksia (ks. ”kaksisuuntainen muuttuja”, edellä), koska ne ovat korreloitujen arvojen klusteri, joista kukin vaikuttaa jossain määrin toisiinsa. Siksi edellä esitetty yksinkertainen johtopäätös voi olla väärä.

Esimerkki 5 1950-luvulta lähtien sekä ilmakehän hiilidioksidipitoisuus että lihavuuden määrä ovat kasvaneet jyrkästi. Näin ollen ilmakehän CO2 aiheuttaa lihavuutta.

Rikkaammalla väestöllä on taipumus syödä enemmän ruokaa ja tuottaa enemmän CO2:ta.

Esimerkki 6 HDL (”hyvä”) kolesteroli korreloi negatiivisesti sydänkohtauksen esiintyvyyden kanssa. Siksi HDL:ää nostavien lääkkeiden ottaminen vähentää sydänkohtauksen saamisen mahdollisuutta.

Jatkotutkimukset ovat kyseenalaistaneet tämän johtopäätöksen. Sen sijaan voi olla, että muut taustatekijät, kuten geenit, ruokavalio ja liikunta, vaikuttavat sekä HDL-tasoihin että sydänkohtauksen todennäköisyyteen; on mahdollista, että lääkkeet vaikuttavat suoraan mitattavaan tekijään, HDL-tasoihin, vaikuttamatta sydänkohtauksen todennäköisyyteen.

Kaksisuuntainen syy-yhteys: A aiheuttaa B:n, ja B aiheuttaa AEdit

Kausaliteetti ei välttämättä ole yksisuuntainen; petoeläin-saalis-suhteessa petojen määrä vaikuttaa saaliin määrään, mutta saaliin määrä eli ravinnon saanti vaikuttaa myös petojen määrään. Toinen tunnettu esimerkki on se, että pyöräilijöillä on pienempi painoindeksi kuin ihmisillä, jotka eivät pyöräile. Tämä selitetään usein olettamalla, että pyöräily lisää fyysistä aktiivisuutta ja siten pienentää painoindeksiä. Koska pyöräilyä lisäävistä ihmisistä tehtyjen prospektiivisten tutkimusten tulokset osoittavat pienempää vaikutusta BMI:hen kuin poikkileikkaustutkimusten tulokset, voi olla myös käänteistä kausaalisuutta (eli ihmiset, joilla on alhaisempi BMI, pyöräilevät todennäköisemmin).

Suhde A:n ja B:n välillä on sattumanvarainen Muokkaa

Pääartikkeli: Satunnainen suhde

Kaksi muuttujaa eivät liity toisiinsa lainkaan, vaan korreloivat sattumalta. Mitä enemmän asioita tutkitaan, sitä todennäköisempää on, että kaksi toisiinsa liittymätöntä muuttujaa näyttää liittyvän toisiinsa. Esimerkiksi:

  • Washington Redskinsin viimeisen kotiottelun tulos ennen presidentinvaaleja ennusti kaikkien presidentinvaalien tuloksen vuodesta 1936 vuoteen 2000 mukaan lukien, vaikka jalkapallo-otteluiden tuloksilla ei ollut mitään tekemistä kansanvaalien tuloksen kanssa. Tämä putki katkesi lopulta vuonna 2004 (tai 2012, jos käytetään alkuperäisen säännön vaihtoehtoista muotoilua).
  • Mierscheidin laki, joka korreloi Saksan sosiaalidemokraattisen puolueen osuuden kansanäänestyksestä Länsi-Saksan raakateräksen tuotannon koon kanssa.
  • Vaihtuvat kaljuuntuneet Venäjän johtajat: Venäjän kalju (tai ilmeisesti kaljuuntuva) valtiojohtaja on seurannut kaljuuntumatonta (”karvaista”) johtajaa ja päinvastoin lähes 200 vuoden ajan.
  • Raamattukoodi, hepreankieliset sanat, jotka ennustavat historiallisia tapahtumia ja joiden oletetaan olevan kätkettyinä Tooraan: kirjainyhdistelmien valtava määrä tekee minkä tahansa sanan esiintymisen riittävän pitkässä tekstissä tilastollisesti merkityksettömäksi.

Vastaa

Sähköpostiosoitettasi ei julkaista.