Qual é a diferença entre os dados em falta do MAR e do MCAR?
Uma das questões importantes com dados em falta é o mecanismo de dados em falta.
É importante porque afecta o quanto os dados em falta enviesam os seus resultados, por isso tem de os ter em conta quando escolhe uma abordagem para lidar com os dados em falta.
Os conceitos destes mecanismos podem ser um pouco abstractos.
E para completar, dois destes mecanismos têm nomes confusos: Faltando Completamente no Random e Faltando no Random.
Missing Completely at Random (MCAR)
Missing Completely at Random é bastante simples. O que significa é o que diz: a propensão para um ponto de dados estar faltando é completamente aleatória.
Não há relação entre se um ponto de dados está faltando e quaisquer valores no conjunto de dados, faltando ou observado.
Os dados faltando são apenas um subconjunto aleatório dos dados.
Missing at Random (MAR)
É aqui que os nomes infelizes entram.
Missing at Random significa que a propensão para um ponto de dados estar faltando não está relacionada com os dados faltantes, mas está relacionada com alguns dos dados observados.
Se alguém respondeu #13 em sua pesquisa não tem nada a ver com os valores faltantes, mas tem a ver com os valores de alguma outra variável.
Um nome melhor seria na verdade Faltando Condicionalmente em Random, porque a falta é condicional a outra variável. Mas não foi isso que o Rubin pegou originalmente, e isso realmente confundiria as siglas neste ponto.
A idéia é, se pudermos controlar para esta variável condicional, podemos obter um subconjunto aleatório.
Você pode imaginar que boas técnicas para dados que estão faltando ao acaso precisam incorporar variáveis que estão relacionadas com a missingness.
______________________________________________________
Este post é parte de uma série de respostas sobre dados faltantes que me foi perguntado durante um webinar recente. Havia quase 300 pessoas no webinar ao vivo, então não conseguimos responder a todas as perguntas. Então eu estou respondendo algumas das que nos faltaram aqui.
Para ver a lista completa de posts desta série, e muito mais, visite nossa página de Dados Faltantes.