Qual è la differenza tra i dati mancanti MAR e MCAR?

Dic 30, 2021
admin

Una delle questioni importanti con i dati mancanti è il meccanismo dei dati mancanti.

È importante perché influisce su quanto i dati mancanti distorcono i tuoi risultati, quindi devi tenerne conto quando scegli un approccio per trattare i dati mancanti.

I concetti di questi meccanismi possono essere un po’ astratti.

E per finire, due di questi meccanismi hanno nomi confusi: Missing Completely at Random e Missing at Random.

Missing Completely at Random (MCAR)

Missing Completely at Random è abbastanza semplice. Ciò che significa è ciò che dice: la propensione di un punto di dati ad essere mancante è completamente casuale.

Non c’è alcuna relazione tra il fatto che un punto di dati sia mancante e qualsiasi valore nella serie di dati, mancante o osservato.

I dati mancanti sono solo un sottoinsieme casuale dei dati.

Missing at Random (MAR)

Ecco dove entrano i nomi infelici.

Mancante a caso significa che la propensione di un punto di dati ad essere mancante non è legata ai dati mancanti, ma è legata ad alcuni dei dati osservati.

Se qualcuno ha risposto o meno al numero 13 nel vostro sondaggio non ha niente a che fare con i valori mancanti, ma ha a che fare con i valori di qualche altra variabile.

Un nome migliore sarebbe in realtà Missing Conditionally at Random, perché la mancanza è condizionata ad un’altra variabile. Ma questo non è quello che Rubin ha scelto originariamente, e sarebbe davvero un casino di acronimi a questo punto.

L’idea è che se possiamo controllare questa variabile condizionale, possiamo ottenere un sottoinsieme casuale.

Puoi immaginare che le buone tecniche per i dati che mancano in modo casuale hanno bisogno di incorporare variabili che sono collegate alla mancanza.

______________________________________________________

Questo post fa parte di una serie di risposte sui dati mancanti che mi è stato chiesto durante un recente webinar. C’erano quasi 300 persone al webinar dal vivo, quindi non siamo riusciti a rispondere a tutte le domande. Quindi sto rispondendo ad alcune di quelle che ci siamo persi qui.

Per vedere l’elenco completo dei post di questa serie, e molto altro, visitate la nostra pagina sui dati mancanti.

Approcci ai dati mancanti: il buono, il cattivo e l’impensabile
Impara i diversi metodi per trattare i dati mancanti e come funzionano in diverse situazioni di dati mancanti.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato.