Cuál es la diferencia entre los datos perdidos MAR y MCAR?

Dic 30, 2021
admin

Una de las cuestiones importantes con los datos perdidos es el mecanismo de datos perdidos.

Es importante porque afecta a la medida en que los datos perdidos sesgan sus resultados, por lo que hay que tenerlo en cuenta al elegir un enfoque para tratar los datos perdidos.

Los conceptos de estos mecanismos pueden ser un poco abstractos.

Y para colmo, dos de estos mecanismos tienen nombres confusos: Missing Completely at Random y Missing at Random.

Missing Completely at Random (MCAR)

Missing Completely at Random es bastante sencillo. Lo que significa es lo que dice: la propensión a que falte un punto de datos es completamente aleatoria.

No hay relación entre que falte un punto de datos y cualquier valor del conjunto de datos, faltante u observado.

Los datos que faltan son sólo un subconjunto aleatorio de los datos.

Falta al azar (MAR)

Aquí es donde entran los nombres desafortunados.

La falta al azar significa que la propensión a que un punto de datos falte no está relacionada con los datos que faltan, pero sí con algunos de los datos observados.

El hecho de que alguien haya respondido o no al número 13 en su encuesta no tiene nada que ver con los valores que faltan, pero sí con los valores de alguna otra variable.

Un nombre mejor sería en realidad Falta condicionada al azar, porque la falta está condicionada a otra variable. Pero eso no es lo que Rubin eligió originalmente, y realmente desordenaría las siglas en este punto.

La idea es que, si podemos controlar esta variable condicional, podemos obtener un subconjunto aleatorio.

Se puede imaginar que las buenas técnicas para los datos que faltan al azar necesitan incorporar variables que están relacionadas con la falta.

______________________________________________________

Este post es parte de una serie de respuestas sobre los datos que faltan que me preguntaron durante un reciente seminario web. Había casi 300 personas en el seminario web en vivo, por lo que no llegamos a todas las preguntas. Así que estoy respondiendo a algunas de las que nos faltaron aquí.

Para ver la lista completa de publicaciones en esta serie, y mucho más, visite nuestra página de Datos Perdidos.

Aproximaciones a los datos perdidos: lo bueno, lo malo y lo impensable
Aprenda los diferentes métodos para tratar los datos perdidos y cómo funcionan en diferentes situaciones de datos perdidos.

Deja una respuesta

Tu dirección de correo electrónico no será publicada.