Introducción

 

Vol. 9 número especial 2018 – Epub               

 

En diciembre de 2017, a solicitud del Consejo Nacional de Evaluación de la Política de Desarrollo Social (CONEVAL), el Instituto Nacional de Estadística y Geografía (INEGI) dio a conocer en su página de internet los resultados del Modelo Estadístico 2015 para la continuidad del Módulo de Condiciones Socioeconómicas de la Encuesta Nacional de Ingresos y Gastos de los Hogares (MCS-ENIGH). El Modelo se presentó con el objetivo de “…proveer a los usuarios de la información con los insumos necesarios para la medición quinquenal de la pobreza multidimensional municipal, correspondiente a 2015…”. La necesidad de este modelo, a su vez, se derivó de que los resultados del MCS 2015, que el INEGI publicó en julio del 2016, presentaban una discontinuidad en el ingreso de los hogares en relación con los datos del MCSENIGH 2014, ya que mostraba variaciones inconsistentes, respecto de lo que cabía esperar como razonable dada la dinámica de la actividad económica y del empleo ocurrida entre el 2014 y 2015. Era, entonces, evidente que las cifras de los ingresos de los hogares del MCS 2015 no encajaban con la serie bienal del MCS-ENIGH que comenzó en el 2008. Esta discontinuidad resultó fundamentalmente de impactos no esperados de mejoras en la capacitación y en la estrategia operativa, orientados a lograr un mayor apego al diseño original de la Encuesta. Las mejoras en la capacitación hicieron énfasis en la importancia de evitar que los informantes evadieran reportar su ingreso, que ofrecieran información sobre sus ingresos claramente inconsistente con lo necesario para subsistir, con su evidente nivel de vida o con el resto de la información entregada en la ENIGH. Por su parte, la estrategia operativa implementó sistemas más acuciosos del seguimiento del avance en campo y estableció mecanismos de reconsulta que se detonaban desde oficinas centrales para verificar los reportes de ingresos nulos y otras inconsistencias que se detectaban en el análisis de gabinete.1

Dado que el objetivo fundamental del MCS 2015 era la medición de la pobreza multidimensional por parte del CONEVAL y que dicha institución requería que las cifras de ingresos mantuvieran la continuidad con la serie previa, junto con el INEGI decidieron integrar un grupo técnico de trabajo (al que luego se sumó un conjunto de especialistas académicos y de la sociedad civil) al cual se denominó Grupo Técnico Ampliado (GTA), cuyo propósito era realizar y discutir una serie de trabajos de diagnóstico sobre lo ocurrido a partir de la cual se consideró que era posible generar un modelo estadístico que permitiera recuperar la continuidad de la serie histórica mediante la combinación de los resultados del MCS 2015 con los provenientes de levantamientos previos, así como del posible uso de fuentes complementarias que ayudaran a establecer el contexto de los cambios en el tiempo. La elección del modelo, sin embargo, no era obvia, por lo que se decidió avanzar de manera simultánea en varias avenidas metodológicas, cada una con sus propios supuestos, alcances y limitaciones. De entre las distintas alternativas consideradas se eligió la que finalmente se consideró como la más adecuada para atender el problema en cuestión, la cual se publicó en la sección de investigación de la página del INEGI en internet,2 y cuya metodología se usó también en el Modelo Estadístico 2016 para la continuidad del MCS-ENIGH.3 Los usuarios especializados podrán encontrar ahí no solo los resultados del Modelo sino, también, una nota técnica que lo describe. Sin embargo, en aras de una mayor transparencia y por considerarlo de utilidad e interés para los especialistas, en este número especial de REALIDAD, DATOS Y ESPACIO. REVISTA INTERNACIONAL DE ESTADÍSTICA Y GEOGRAFÍA, el INEGI presenta un artículo que amplía y detalla la nota técnica arriba referida, así como los trabajos correspondientes a las alternativas que se ensayaron al interior del GTA. Con ello se espera dejar testimonio del esfuerzo realizado, a la vez de ofrecer, a través de estos trabajos, elementos adicionales que abordan, con distintos énfasis y perspectivas, aristas complementarias de una misma realidad, las cuales, al final, pueden resultar en aspectos informativos útiles para tener una apreciación más cabal de lo que está detrás de la discontinuidad de los ingresos de la serie del MCS-ENIGH en el 2015 y 2016, así como de varios de los principales retos que se enfrentan al momento de generar información vía encuestas de ingresos aplicadas a los hogares en México.

Cuando comparamos entre dos encuestas que hacen las mismas preguntas sobre ingreso corriente total de los hogares a la misma población, pero en momentos distintos, sabemos que los ingresos reportados pueden ser diferentes porque cambió: 1) el número total de hogares, 2) el ingreso promedio por perceptor en el hogar y 3) el número de perceptores en el hogar. Los dos primeros artículos de este número especial abordan la pregunta de en qué medida el cambio de los ingresos entre el 2014 y 2015 responde a un incremento en el número de hogares reportados en la muestra que pudiera ir más allá de lo que las tendencias de la dinámica demográfica nos harían esperar. Cabe subrayar que estos dos trabajos no pretenden alinear las otras dos fuentes de cambio del ingreso para el año en cuestión, sino única y exclusivamente la que proviene del incremento en el número de hogares. De esta manera, el artículo de Víctor Alfredo Bustos y de la Tijera, titulado Ajuste demográfico por posestratificación, modifica el número de hogares mediante una técnica de posestratificación que busca corregir los factores de expansión de los hogares según su estrato sociodemográfico, para acercarlos a la estructura de la Encuesta Intercensal 2015. Por su parte, el de Benito Durán Romo, que se presenta con el título de Ajuste demográfico por imputación, utiliza técnicas de imputación tipo Cold Deck con las cuales asigna integrantes adicionales a los hogares levantados en el MCS 2015, de manera que, con unos más grandes, sea necesaria una menor cantidad de ellos para expandir a la misma población total de referencia, atemperando, así, la tendencia del tamaño promedio de los hogares hasta hacerla consistente con las tendencias implícitas de las proyecciones de población del Consejo Nacional de Población (CONAPO). Es importante notar que cada uno de estos dos enfoques responde a una hipótesis distinta sobre el origen de la diferencia en el número de hogares observado en el 2015. Así, la posestratificación supone que, en tanto la información captada es precisa, el problema a corregir está en las discrepancias entre tamaños relativos de subpoblaciones tanto según la Encuesta Intercensal como los resultantes de la selección de la muestra y del levantamiento. En contraste, el enfoque de imputación Cold Deck supone que el problema proviene de campo, en el sentido de que al momento de aplicar el cuestionario se hubiera tenido alguna subenumeración de pobladores de los hogares, dando como resultado unos de tamaño promedio menor al real y, en consecuencia, un mayor número de hogares (necesario para cuadrar con el total de población de la proyección del CONAPO utilizada como referente o benchmark).

Ahora, considerando los ejercicios propiamente diseñados para tratar de recuperar la continuidad de los ingresos del MCS 2015 con respecto a la serie previa, comenzamos por el propuesto por Rodrigo Negrete Prieto y Benito Durán Romo que se presenta con el nombre de Ajuste del MCS 2015 por alineación de deciles. En éste se presenta una técnica que ellos denominan Delta, la cual parte de la premisa de que las mejoras en la captación del ingreso implementadas en el 2015 incidieron en una menor cantidad de hogares con ingresos cero o con unos bajos de manera desproporcionada (pseudoceros), lo cual implicó un desplazamiento hacia arriba de los valores de los ingresos que delimitan cada uno de los deciles de hogares cuando éstos se ordenan según su nivel de ingreso corriente total. A partir de lo anterior, los autores notan que cada decil de hogares reportado en el MCS 2015 combina hogares con ingresos que cabría esperar en ese decil, con otros con ingresos que en los levantamientos anteriores se habrían presentado en un decil más alto. Esto significa que al comparar los deciles del MCS 2014 con los del MCS 2015 en realidad no se están comparando peras con peras, sino que serían peras con peranzanas. En este sentido, la recuperación de la continuidad histórica de la serie supondría quitar en lo posible la fracción manzana de los hogares de cada decil (puesto que en los levantamientos previos no correspondería a ese estrato de ingreso, sino a uno mayor) y modificar los factores de expansión de manera que se deje el estrato integrado casi totalmente por hogares con ingresos tipo pera. Al hacer esto se estaría reconociendo que el mejor esfuerzo de campo del MCS 2015 habría hecho que los hogares con menores ingresos de este levantamiento tuvieran ingresos promedio mayores a los de los levantamientos inmediatos anteriores, afectando —en una especie de efecto dominó— los ingresos de cada uno de los cuantiles superiores en que es posible ordenar a los hogares según su ingreso.

Otra opción que se exploró consistió en explotar la relación entre el ingreso y sus covariables según fueron captadas en los levantamientos anteriores utilizando técnicas de Machine Learning, que es lo que se hace en el trabajo de José Alejandro Ruiz Sánchez denominado Propuesta para recuperar la continuidad del MCS 2015 usando máquinas de soporte vectorial. Esta propuesta es similar a la de las peranzanas (método Delta) descrita arriba en el sentido de que identifica a los hogares de cada decil en el 2015 que, conforme a las experiencias pasadas, corresponderían a ese decil y ajusta los factores de expansión para que ese subconjunto de hogares represente 10% del total de hogares. Sin embargo, la manera de hacer el pronóstico del decil al que correspondería cada hogar es diferente, en virtud del uso de técnicas de clasificación. Asimismo, el uso de este método facilita emplear un conjunto de referencia más amplio (en este caso los MCS-ENIGH del 2010, 2012 y 2014) que sirvió como entrenamiento a partir del cual se caracterizaron relaciones entre las covariables y el decil de pertenencia de cada hogar; esta relación es trasladada al MCS 2015 para pronosticar el decil al que pertenecería un hogar en ese año.

Un enfoque más tradicional para intentar recuperar la continuidad de la serie de ingresos de los hogares es el que sigue Alfredo Bustos en su documento Ajuste de una base de datos vía modelos lineales, en el que se explota la relación observada en el pasado entre un conjunto amplio de covariables recabadas por la ENIGH y el ingreso, de manera que se pueda aprovechar esa asociación en un modelo de regresión para generar una versión estimada del ingreso a partir de sus covariables en el 2015. A efecto de tomar en consideración las diferencias de los pesos relativos que esas covariables pudieran tener en diferentes grupos de la población, el trabajo modela por separado el comportamiento del ingreso al interior de cada uno de los cuatro estratos socioeconómicos en los que se agrupan las unidades primarias de muestreo en el Marco Nacional de Viviendas, de manera que se tiene un modelo lineal por cada estrato. En adición a lo anterior, este enfoque busca tomar en consideración especificidades coyunturales del año para el que se hizo la estimación (2015) por medio de la explotación de la información implícita en la distribución de los errores. Además de lo anterior, se corrige el número de hogares usando el modelo de posestratificación mencionado arriba.

Partiendo del supuesto de que solo hay que corregir los ingresos y de que se conoce el conjunto de hogares en la muestra del 2015 cuyos ingresos deben ser corregidos por no corresponder con lo que se esperaría a partir de la serie previa, es posible, también, construir un modelo para llevar a cabo imputaciones múltiples, como el que proponen Delfino Vargas Chanes y Servando Valdés Cruz en su Ajuste estadístico a la distribución del ingreso en el Módulo de Condiciones Socioeconómicas 2015 mediante imputaciones múltiples. En este modelo se descartan los valores que se van a corregir y se les trata como si fueran en realidad datos faltantes Missing at Random, por lo que se supone que la propensión de que algún dato (de ingreso, en este caso) sea faltante se relaciona con algunos de los datos observados, de manera que es posible utilizarlos (p. ej. las covariables del ingreso) para estimar parámetros que permitan modelar bajo ciertos supuestos los valores de los datos faltantes. Dado que lo que se busca reconstruir es la parte baja de la distribución del ingreso, los autores seleccionaron un conjunto amplio de covariables especialmente relacionadas con los ingresos de la población pobre, las cuales se articulan por medio de un modelo estadístico a partir del cual se estiman los valores esperados de las observaciones faltantes que se utilizarán para hacer las imputaciones correspondientes. En este trabajo no se estima de forma directa un valor imputado, sino que se recurre a un proceso Monte Carlo de simulación que resulta en 10 distintas bases de datos, que se resumen al final en un solo modelo de regresión con el fin de hacer imputaciones que tomen en consideración la variabilidad de los datos a modificar y, así, tener imputaciones finales lo mejor informadas y más realistas posible.

Una covariable del ingreso que tiene una asociación teórica y empírica relevante con el ingreso es el gasto. En el trabajo de Edgar Vielma Orozco, Octavio Heredia Hernández y José Vences Rivera, Ajuste por factor de crecimiento con base en el indicador de gasto de la ENIGH, se busca aprovechar esta asociación y el hecho de que en la ENIGH 2016 el gasto no parece mostrar el desfase con la serie previa que se observa en la información de ingreso. Así las cosas, el modelo de regresión lineal simple que se utiliza busca establecer la relación histórica entre gasto e ingreso y usarla para estimar el ingreso corriente total de los hogares en el 2016 a partir del gasto monetario reportado en ese año y, finalmente, dado que en el MCS 2015 no se levantó información de gastos, recurrir a una interpolación para asignar las estimaciones de ingreso que corresponderían al MCS 2015. Cabe señalar que en este ejercicio no se corrige todo el vector de ingresos sino solo aquellos casos justificados correspondientes a conjuntos de hogares (definidos por entidad federativa, tamaño de localidad y estrato socioeconómico) en los que se observa un desfase entre la dinámica del ingreso y la de gasto del 2014 al 2016.

Entrando ahora en el ámbito de la generación de modelos para reestablecer la continuidad de la serie para el 2016 y siguiendo en la línea de explorar el gasto como elemento articulador en la serie de tiempo del ingreso corriente de los hogares, Propuesta de ajuste de la distribución del ingreso corriente total per cápita mediante el gasto corriente total per cápita, artículo desarrollado por Alida M. Gutiérrez-Landeros, Marco A. Romero-Navarro, Mariana Galindo-Orozco, Carolina Chávez-Ruelas, David Rojas-Rosey, David López-Lira Bayod y Ricardo Aparicio-Jiménez, parte del supuesto de que una buena estimación del ingreso de los hogares en el 2016 resulta de suponer que la tasa de crecimiento del ingreso corriente total promedio per cápita del 2014 al 2016 es la misma que la del gasto corriente total per cápita, distinguiendo, para ello, entre la dinámica observada para el ámbito urbano y la del rural. Con ello se logra generar una nueva versión del vector de ingresos de los hogares para el 2016, que es consistente con la trayectoria previamente observada (hasta el 2014).

Luego de considerar todas las alternativas a la mano, el enfoque que finalmente se transformó en la base del Modelo Estadístico 2016 para la continuidad del MCS-ENIGH, así como del Modelo Estadístico 2015 para la continuidad del MCSENIGH, corresponde al trabajo desarrollado por Alejandro Ruiz y Ana Miriam Romo Anaya, el cual propone “…una metodología de edición de microdatos basada en el ajuste de una función de distribución bajo restricciones…”. El proceso comienza por tomar en consideración el crecimiento de la mediana del ingreso laboral reportado por la ENOE del 2014 al 2016 (para el Modelo 2016) y del 2014 al 2015 (para el Modelo 2015) para cada una de las 32 entidades federativas del país. Este crecimiento es luego aplicado a la mediana del ingreso corriente total del MCSENIGH del 2014 de cada uno de los estados. Ello arroja como resultado 32 medianas objetivo del ingreso corriente total de los hogares en el 2015 o en el 2016, según sea el caso, las cuales, junto con el valor máximo observado del ingreso corriente total en cada entidad federativa, se erigen luego en restricciones que debe cumplir la estimación por máxima verosimilitud de los cuatro parámetros de una función de distribución Beta Generalizada del tipo II (GB2), ajustada a los datos de la distribución del ingreso recolectado en campo correspondiente al MCS 2015 o a la ENIGH 2016. La versión de la distribución del ingreso resultante es luego comparada con el ajuste sin restricciones de la misma forma funcional GB2 a los datos de ingreso corriente total del MCS 2015 y la ENIGH 2016. Al comparar ambas estimaciones de la misma forma funcional es posible obtener un cociente entre el ingreso restringido y el ingreso sin restringir para cada hogar en la muestra. Este cociente se usa para corregir hogar por hogar el ingreso laboral (en estricto sentido, es el ingreso por trabajo principal) a partir de los datos de ingreso publicados originalmente para el MCS 2015 y la ENIGH 2016. Enseguida, partiendo de una constante empírica de la relación entre el ingreso laboral con su complemento se establece, también para cada hogar, el valor que corresponde al ingreso corriente total del 2015 o del 2016, según sea el caso, cerrándose de esa manera el proceso. Los resultados de estos modelos, con sus correspondientes microdatos, están publicados en la página del INEGI en el apartado de Investigación y se puede acceder a ellos desde la liga http:// www.beta.inegi.org.mx/proyectos/investigacion/eash/2016/.

Finalmente, como artículo de cierre de este número especial se presenta el trabajo Incentivos, error de medición y estimación de la pobreza en México, desarrollado por Alfonso Miranda y Jaime Sainz Santamaría. En él se hace una revisión de lo ocurrido en torno a la publicación de los resultados del MCS 2015 y algunas consideraciones respecto a las posibles causas de la discontinuidad de los niveles de los ingresos corrientes de los hogares, en especial en la parte izquierda de la distribución, respecto a la serie histórica previa de los MCS-ENIGH. Indican que tales cambios probablemente son resultado de modificaciones en los incentivos enfrentados por los entrevistadores (por vía de un fortalecimiento en apariencia marginal de su capacitación, así como de un más estricto control de operaciones en campo y de supervisión, orientados a que el personal de campo cumpliera de la mejor manera posible con el desempeño de sus funciones) y que si bien parece ser que la discontinuidad obedece a mejoras operativas y de capacitación en la ENIGH, la ruptura con la serie previa es inobjetable, con la desventaja de que no se cuenta con algún estudio previo que documentara de manera oportuna las ventajas para la medición del ingreso de los cambios implementados. Por otra parte, los autores hacen una revisión de las ventajas y desventajas de los distintos modelos alternativos que se trabajaron desde el INEGI y ofrecen sugerencias del tipo de experimentos que sería necesario realizar para tener una mayor claridad de lo sucedido, además de que proponen líneas de trabajo para profundizar en la mejoría de las estadísticas microeconómicas sobre distribución del ingreso, subrayando en especial las ventajas de los estudios longitudinales de tipo panel.

Con la presentación de esta colección de trabajos, el INEGI busca hacer del conocimiento de las y los especialistas interesadas(os) en la materia los detalles técnicos de los diferentes esfuerzos emprendidos para recuperar la continuidad de la serie de ingresos de los hogares del MCS-ENIGH que se requieren por parte del CONEVAL para dar continuidad a las mediciones de pobreza multidimensional que dicha institución está obligada a realizar a partir de la información que le entrega el INEGI. Con este ejercicio de transparencia, el Instituto quiere, por una parte, reconocer y agradecer los esfuerzos que en el marco del GTA desarrollaron especialistas de la sociedad civil, la Academia, el CONEVAL y el mismo INEGI. Por otra, la publicación de estos trabajos tiene también el objetivo de aportar al acervo de conocimientos sobre esta materia tan relevante, conscientes de que el progreso científico se fortalece con el intercambio libre y abierto de ideas, de manera que esperamos que estos artículos sirvan no solo como reportes de métodos y hallazgos, sino que también se transformen en referentes para apuntalar futuras investigaciones.

_____

1 Para una descripción más detallada de la investigación de las causas de la discontinuidad del ingreso de los hogares que apareció en el MCS 2015, ver: bit.ly/4bHPipK

2 bit.ly/2OvI2G9

3 bit.ly/466byIJ

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *