Wat is het verschil tussen MAR en MCAR missing data?

dec 30, 2021
admin

Een van de belangrijke kwesties bij ontbrekende gegevens is het mechanisme voor ontbrekende gegevens.

Het is belangrijk omdat het van invloed is op de mate waarin de ontbrekende gegevens uw resultaten vertekenen, dus u moet er rekening mee houden bij het kiezen van een benadering om met de ontbrekende gegevens om te gaan.

De concepten van deze mechanismen kunnen een beetje abstract zijn.

En om het nog erger te maken, hebben twee van deze mechanismen verwarrende namen: Missing Completely at Random en Missing at Random.

Missing Completely at Random (MCAR)

Missing Completely at Random is tamelijk rechttoe rechtaan. Het betekent wat het zegt: de neiging van een gegevenspunt om te ontbreken is volledig willekeurig.

Er is geen verband tussen het al dan niet ontbreken van een gegevenspunt en enige waarden in de dataset, ontbrekende of waargenomen.

De ontbrekende gegevens zijn slechts een willekeurige subset van de gegevens.

Missing at Random (MAR)

Daar komen de ongelukkige namen om de hoek kijken.

Missing at Random betekent dat de neiging van een gegevenspunt om te ontbreken geen verband houdt met de ontbrekende gegevens, maar wel met sommige van de waargenomen gegevens.

Hoewel iemand #13 antwoordde op uw enquête, heeft niets te maken met de ontbrekende waarden, maar wel met de waarden van een andere variabele.

Een betere naam zou eigenlijk Missing Conditionally at Random zijn, omdat de missingness voorwaardelijk is voor een andere variabele. Maar dat is niet wat Rubin oorspronkelijk koos, en het zou echt de acroniemen in de war schoppen op dit punt.

Het idee is, als we kunnen controleren voor deze voorwaardelijke variabele, kunnen we een willekeurige subset krijgen.

U kunt zich voorstellen dat goede technieken voor gegevens die willekeurig ontbreken, variabelen moeten bevatten die verband houden met de missingness.

______________________________________________________

Dit bericht maakt deel uit van een reeks antwoorden over ontbrekende gegevens die mij tijdens een recent webinar werden gevraagd. Er waren bijna 300 mensen op de live webinar, dus we zijn niet aan alle vragen toegekomen. Daarom beantwoord ik hier een aantal vragen die we hebben gemist.

Om de volledige lijst van berichten in deze serie te zien, en nog veel meer, bezoek onze Missing Data pagina.

Benaderingen van ontbrekende gegevens: het goede, het slechte en het ondenkbare
Leer de verschillende methoden voor het omgaan met ontbrekende gegevens kennen en hoe ze in verschillende situaties met ontbrekende gegevens werken.

Geef een antwoord

Het e-mailadres wordt niet gepubliceerd.