MONETA PIZARRO ADRIÁN MAXIMILIANO
Congresos y reuniones científicas
Título:
Datos faltantes de ingresos en la EPH: una revisión del supuesto MAR
Lugar:
Montevideo
Reunión:
Congreso; XIV Congreso Latinoamericano de Sociedades de Estadística; 2021
Institución organizadora:
Sociedad Uruguaya de Estadística
Resumen:
Un problema frecuente cuando se trabaja con datos de la Encuesta Permanente de Hogares (EPH) del Instituto Nacional de Estadísticas y Censos (INDEC) de Argentina, es la presencia de no respuesta y valores perdidos en los ingresos monetarios. Este fenómeno afecta especialmente a quienes requieren estos datos para la clasificación de individuos y hogares con el objetivo de estimar de manera insesgada relevantes indicadores socioeconómicos para las políticas públicas tales como, por ejemplo, las tasas de pobreza e indigencia.La literatura disponible da cuenta de un variado conjunto de métodos para lidiar con esta dificultad: desde métodos tradicionales de eliminación y reponderación, hasta técnicas m´as avanzadas de imputación de datos faltantes. Sin embargo, la eficacia de cada uno de estas técnicas depende críticamente del mecanismo de generación de los valores perdidos. En general, estos procedimientos parten del cumplimiento de algún supuesto sobre el mecanismo de generación de los valores faltantes y requieren, como mínimo, que los datos omitidos sean missing at random (MAR). Esto es que los valores perdidos aparezcan aleatoriamente condicionados a determinadas variables observadas. Por lo tanto, es de suma relevancia determinar si las personas que no declaran sus ingresos reúnen características particulares que las distinguen de los declarantes.En este trabajo se analizan las diferencias entre declarantes y no declarantes de los ingresos monetarios en la EPH, centrando la atención en los datos del IV trimestre 2020. Dada la naturaleza categórica de los datos observados disponibles, en primera instancia se realiza un análisis de correspondencias múltiples (ACM) y pruebas chi-cuadrado de independencia para identificar de manera exploratoria en qué variables se observan diferencias significativas. En segunda instancia y sobre la base del primer análisis, se lleva a cabo una regresión logística para determinar cuáles son los factores principales que contribuyen a explicar la falta de respuesta.Los resultados señalan que hay diferencias significativas entre declarantes y no declarantes en un conjunto importante de características relevadas por la EPH. No obstante, también indican que el sexo, la región geográfica, la educación, el sector de actividad (público/privado) y el tipo de ocupación, son los principales determinantes de la no declaración de ingresos. De acuerdo a estos hallazgos, quienes tienen mayor propensión a no informar sus ingresos monetarios son los varones casados con educación secundaria o universitaria, que trabajan en el sector privado como cuentapropistas y residen en el área metropolitanade Buenos Aires o en la región pampeana.