Mi a különbség a MAR és az MCAR hiányzó adatok között?

dec 30, 2021
admin

A hiányzó adatokkal kapcsolatos egyik fontos kérdés a hiányzó adatok mechanizmusa.

Ez azért fontos, mert befolyásolja, hogy a hiányzó adatok mennyire torzítják az eredményeket, ezért figyelembe kell vennie, amikor kiválasztja a hiányzó adatok kezelésére szolgáló megközelítést.

Az e mechanizmusok fogalma kissé elvont lehet.

És mindennek tetejébe két ilyen mechanizmusnak zavaros neve van: Missing Completely at Random és Missing at Random.

Missing Completely at Random (MCAR)

Missing Completely at Random elég egyszerű. Azt jelenti, amit mond: egy adatpont hiányzásának hajlamossága teljesen véletlenszerű.

Nincs kapcsolat aközött, hogy egy adatpont hiányzik-e, és az adathalmaz bármely értéke között, legyen az hiányzó vagy megfigyelt.

A hiányzó adatok csak az adatok véletlenszerű részhalmaza.

Missing at Random (MAR)

Itt jönnek a szerencsétlen nevek.

A véletlenszerű hiányzás azt jelenti, hogy egy adatpont hiányzásának hajlamossága nem a hiányzó adatokkal függ össze, hanem a megfigyelt adatok egy részével.

Az, hogy valaki a 13-as számot válaszolta-e a felmérésen, semmi köze a hiányzó értékekhez, de köze van egy másik változó értékeihez.

Az elnevezés valójában jobb lenne: Missing Conditionally at Random, mert a hiányzás egy másik változótól függ. De Rubin eredetileg nem ezt választotta, és ez most nagyon összekuszálná a rövidítéseket.

Az ötlet az, hogy ha ezt a feltételes változót kontrollálni tudjuk, akkor egy véletlenszerű részhalmazt kapunk.

Elképzelhető, hogy a véletlenszerűen hiányzó adatokra vonatkozó jó technikáknak olyan változókat kell tartalmazniuk, amelyek a hiányzással kapcsolatosak.

______________________________________________________

Ez a bejegyzés a hiányzó adatokról szóló válaszok sorozatának része, amelyeket egy nemrégiben tartott webinárium során kérdeztek tőlem. Az élő webináriumon közel 300-an vettek részt, így nem jutottunk el az összes kérdésig. Ezért itt válaszolok néhány kihagyott kérdésre.

Az ebben a sorozatban szereplő bejegyzések teljes listáját és még sok mást is megtekinthet a Hiányzó adatok oldalunkon.

A hiányzó adatokkal kapcsolatos megközelítések: a jó, a rossz és az elképzelhetetlen
Tanulja meg a hiányzó adatok kezelésére szolgáló különböző módszereket, és hogy hogyan működnek a különböző hiányzó adatokkal kapcsolatos helyzetekben.

Vélemény, hozzászólás?

Az e-mail-címet nem tesszük közzé.