Hvad er forskellen mellem MAR og MCAR manglende data?

dec 30, 2021
admin

Et af de vigtige spørgsmål i forbindelse med manglende data er mekanismen for manglende data.

Det er vigtigt, fordi det påvirker, hvor meget de manglende data forvrænger dine resultater, så du skal tage hensyn til det, når du vælger en metode til at håndtere de manglende data.

Begreberne for disse mekanismer kan være en smule abstrakte.

Og for at gøre det hele komplet, har to af disse mekanismer forvirrende navne: Missing Completely at Random og Missing at Random.

Missing Completely at Random (MCAR)

Missing Completely at Random er ret ligetil. Det betyder, hvad det siger: tilbøjeligheden til at et datapunkt mangler er fuldstændig tilfældig.

Der er ingen sammenhæng mellem, om et datapunkt mangler, og eventuelle værdier i datasættet, manglende eller observerede.

De manglende data er blot en tilfældig delmængde af dataene.

Missing at Random (MAR)

Det er her, de uheldige navne kommer ind i billedet.

Missing at Random betyder, at tilbøjeligheden til at et datapunkt mangler ikke er relateret til de manglende data, men den er relateret til nogle af de observerede data.

Hvis nogen har svaret #13 i din undersøgelse eller ej, har intet at gøre med de manglende værdier, men det har at gøre med værdierne af en anden variabel.

Et bedre navn ville faktisk være Missing Conditionally at Random, fordi missingness er betinget af en anden variabel. Men det er ikke det, Rubin oprindeligt valgte, og det ville virkelig ødelægge akronymerne på dette punkt.

Tanken er, at hvis vi kan kontrollere for denne betingede variabel, kan vi få en tilfældig delmængde.

Du kan forestille dig, at gode teknikker til data, der mangler tilfældigt, skal inkorporere variabler, der er relateret til missingness.

______________________________________________________

Dette indlæg er en del af en serie af svar om manglende data, som jeg blev spurgt om under et nyligt afholdt webinar. Der var næsten 300 personer på live-webinaret, så vi nåede ikke igennem alle spørgsmålene. Så jeg besvarer nogle af dem, vi gik glip af, her.

For at se den fulde liste over indlæg i denne serie og en hel masse andet kan du besøge vores side om manglende data.

Ansatser på manglende data: de gode, de dårlige og de utænkelige
Lær de forskellige metoder til håndtering af manglende data, og hvordan de virker i forskellige situationer med manglende data.

Skriv et svar

Din e-mailadresse vil ikke blive publiceret.