Jaka jest różnica między brakiem danych MAR i MCAR?
Jedną z ważnych kwestii związanych z brakującymi danymi jest mechanizm brakujących danych.
Jest on ważny, ponieważ wpływa na to, jak bardzo brakujące dane uprzedzają wyniki, więc musisz wziąć go pod uwagę przy wyborze podejścia do radzenia sobie z brakującymi danymi.
Koncepcje tych mechanizmów mogą być nieco abstrakcyjne.
A na domiar złego, dwa z tych mechanizmów mają mylące nazwy: Missing Completely at Random i Missing at Random.
Missing Completely at Random (MCAR)
Missing Completely at Random jest całkiem prosty. Oznacza to, co mówi: skłonność do braku punktu danych jest całkowicie losowa.
Nie ma żadnego związku między brakiem punktu danych a jakimikolwiek wartościami w zbiorze danych, brakującymi lub obserwowanymi.
Brakujące dane są po prostu losowym podzbiorem danych.
Missing at Random (MAR)
Tutaj pojawiają się niefortunne nazwy.
Missing at Random oznacza, że skłonność do braku punktu danych nie jest związana z brakującymi danymi, ale jest związana z niektórymi obserwowanymi danymi.
To czy ktoś odpowiedział #13 w twojej ankiecie nie ma nic wspólnego z brakującymi wartościami, ale ma to związek z wartościami jakiejś innej zmiennej.
Lepszą nazwą byłoby Missing Conditionally at Random, ponieważ brak jest uwarunkowany inną zmienną. Ale to nie jest to, co Rubin pierwotnie wybrał, i to naprawdę pomieszałoby akronimy w tym momencie.
Pomysł jest taki, że jeśli możemy kontrolować tę zmienną warunkową, możemy uzyskać losowy podzbiór.
Możesz sobie wyobrazić, że dobre techniki dla danych, które są brakujące w sposób losowy muszą zawierać zmienne, które są związane z brakiem.
______________________________________________________
Ten post jest częścią serii odpowiedzi na temat brakujących danych, o które zostałem zapytany podczas ostatniego webinaru. W webinarium na żywo uczestniczyło prawie 300 osób, więc nie zdążyliśmy odpowiedzieć na wszystkie pytania. Odpowiadam więc tutaj na niektóre z tych, które nam umknęły.
Aby zobaczyć pełną listę postów z tej serii i wiele innych, odwiedź naszą stronę Brakujące dane.
.