Care este diferența dintre datele lipsă MAR și MCAR?
Una dintre problemele importante legate de datele lipsă este mecanismul datelor lipsă.
Este important pentru că afectează cât de mult datele lipsă vă influențează rezultatele, așa că trebuie să țineți cont de el atunci când alegeți o abordare pentru a trata datele lipsă.
Conceptele acestor mecanisme pot fi un pic abstracte.
Și, pe deasupra, două dintre aceste mecanisme au nume confuze: Missing Completely at Random și Missing at Random.
Missing Completely at Random (MCAR)
Missing Completely at Random (MCAR)
Missing Completely at Random este destul de simplu. Ceea ce înseamnă este ceea ce spune: tendința ca un punct de date să lipsească este complet aleatorie.
Nu există nicio relație între faptul că un punct de date lipsește și orice valoare din setul de date, lipsă sau observată.
Datele lipsă sunt doar un subset aleatoriu al datelor.
Missing at Random (MAR)
Aici intervin denumirile nefericite.
Missing at Random înseamnă că tendința ca un punct de date să lipsească nu are legătură cu datele lipsă, dar are legătură cu unele dintre datele observate.
Dacă cineva a răspuns sau nu la #13 în sondajul dumneavoastră nu are nimic de-a face cu valorile lipsă, dar are de-a face cu valorile unei alte variabile.
Un nume mai bun ar fi de fapt Missing Conditionally at Random, pentru că lipsa este condiționată de o altă variabilă. Dar asta nu este ceea ce Rubin a ales inițial și ar încurca foarte mult acronimele în acest moment.
Ideea este că, dacă putem controla această variabilă condiționată, putem obține un subset aleatoriu.
Vă puteți imagina că tehnicile bune pentru datele care lipsesc la întâmplare trebuie să încorporeze variabile care au legătură cu lipsa datelor.
______________________________________________________
Acest post face parte dintr-o serie de răspunsuri despre datele lipsă care mi-au fost cerute în timpul unui webinar recent. Au fost aproape 300 de persoane la webinarul live, așa că nu am reușit să răspundem la toate întrebările. Așa că răspund aici la unele dintre cele pe care le-am ratat.
Pentru a vedea lista completă a postărilor din această serie, și multe altele, vizitați pagina noastră Missing Data.
.