Mitä eroa on MAR- ja MCAR-tietojen puuttumisen välillä?
Yksi puuttuvien tietojen tärkeistä kysymyksistä on puuttuvien tietojen mekanismi.
Se on tärkeä, koska se vaikuttaa siihen, kuinka paljon puuttuvat tiedot vääristävät tuloksiasi, joten se on otettava huomioon valittaessa lähestymistapaa puuttuvien tietojen käsittelyyn.
Käsitteet näistä mekanismeista voivat olla hieman abstrakteja.
Ja kaiken kukkuraksi kahdella näistä mekanismeista on sekavat nimet: Missing Completely at Random ja Missing at Random.
Missing Completely at Random (MCAR)
Missing Completely at Random on melko yksinkertainen. Se tarkoittaa sitä, mitä se sanoo: datapisteen puuttumisen taipumus on täysin satunnainen.
Ei ole mitään yhteyttä sen välillä, puuttuuko datapiste, ja minkään datajoukon arvojen, puuttuvien tai havaittujen, välillä.
Puuttuvat tiedot ovat vain satunnainen osajoukko datasta.
Missing at Random (MAR)
Tässä kohtaa tulevat esiin epäonniset nimet.
Missing at Random tarkoittaa, että datapisteen puuttumisen taipumus ei liity puuttuviin tietoihin, mutta se liittyy joihinkin havaittuihin tietoihin.
Vaikka joku vastasi kyselyssäsi numeroon 13, sillä ei ole mitään tekemistä puuttuvien arvojen kanssa, mutta sillä on tekemistä jonkin muun muuttujan arvojen kanssa.
Parempi nimitys olisi itse asiassa Missing Conditionally at Random (Puuttuu ehdollisesti sattumanvaraisesti)
Missing Conditionally at Random (Puuttuva ehdollisesti sattumanvaraisesti)
, koska puuttuvuus on ehdollinen jostain muusta muutoksesta. Mutta Rubin ei alun perin valinnut sitä, ja se sotkisi lyhenteet tässä vaiheessa.
Ajatuksena on, että jos pystymme kontrolloimaan tätä ehdollista muuttujaa, voimme saada satunnaisen osajoukon.
Voit kuvitella, että hyvät tekniikat satunnaisesti puuttuville tiedoille täytyy sisällyttää muuttujia, jotka liittyvät puuttuvuuteen.
______________________________________________________
Tämä viesti on osa sarjaa vastauksia puuttuvista tiedoista, joita minulta kysyttiin hiljattain pidetyssä webinaarissa. Suorassa webinaarissa oli lähes 300 osallistujaa, joten emme ehtineet käydä kaikkia kysymyksiä läpi. Vastaan tässä siis joihinkin niistä, jotka jäivät vastaamatta.
Katso koko luettelo tämän sarjan viesteistä ja paljon muuta puuttuvat tiedot -sivullamme.