Influencia del consumo en la felicidad
Influence of Consumption in Happiness
Rafael Garduño Rivera* y Silvia Guadarrama González**
* Centro de Investigación y Docencia Económicas, rafael.garduno@cide.edu
** Secretaría del Trabajo y Previsión Social, silvia.guadarrama@cimat.mx
Vol. 8 Núm. 1 Influencia del consumo…
El bienestar subjetivo ha cobrado relevancia a nivel internacional no hace mucho tiempo, y en México se ha comenzado a estudiar desde la presente década. Encontrar los determinantes de la felicidad ha constituido una interrogante para ser investigada en distintos trabajos alrededor del mundo con el fin de aportar información para la realización de políticas públicas cada vez más detalladas. Entre las variables más recurridas para explicarla se encuentra el ingreso, quedando el consumo poco estudiado a profundidad. El trabajo de aplicación que se presenta estudia a fondo la relación que tiene el consumo de los mexicanos con el nivel de felicidad reportado en cuatro categorías por medio de dos técnicas de modelado de variables independientes categóricas: logístico ordinal y multinomial. Palabras clave: consumo; felicidad; satisfacción con la vida; modelo logístico multinomial; modelo logístico ordinal. |
It has not been long since Subjective Well-Being (SWB) has become a relevant subject at international level. In Mexico, it started to be studied in this decade. To find the determinants of happiness has been the aim of research throughout the world, in order to provide information and to design detailed public policies. Income is one of the most common variables used to explain happiness, but consumption has not been studied in depth. This paper analyses the relationship between Mexicans’ consumption and their level of happiness, reported in four categories. This relationship is studied using two modeling techniques of categorical independent variables: ordinal logistic and multinomial. Key words: consumption; happiness; life satisfaction; multinomial logistic model; ordinal logistic model. |
Recibido: 16 de mayo de 2016.
Aceptado: 7 de septiembre de 2016.
“Si el dinero no te hace feliz probablemente no lo estás gastando bien.”
Journal of Consumer Psychology
Antecedentes
La felicidad es el fin supremo de todo hombre, según Aristóteles, quien también decía que, para encontrarla, además de obrar bien, era necesario vivir bien. Desde entonces, y principalmente durante el siglo XVIII, su estudio ha estado en manos de diferentes tipos de especialistas —como religiosos, filósofos éticos, utilitaristas, sociólogos y psicólogos— que, en concordancia con Aristóteles, han entendido que la felicidad es un fin en sí mismo y no un medio para alcanzar algo más. De este modo, cada disciplina la estudia con una perspectiva distinta, complementando el conocimiento de este tema que, sin duda, es transdisciplinario (Rojas, 2014a).
La incursión de la Economía en el estudio de la felicidad es más reciente. Desde la perspectiva de esta disciplina, el antecedente más cercano lo encontramos en la llamada economía del bienestar, que surgió a finales de la Segunda Guerra Mundial. Desde ese momento, los intereses más inmediatos de los gobiernos eran el crecimiento económico, el combate a la pobreza y al hambre, la satisfacción de necesidades materiales y elevar estándares de vida en general para la población. Los indicadores clave eran todos aquellos que estuvieran relacionados con la calidad de vida de las personas, es decir, indicadores indirectos a la felicidad, pero que se consideraba que estaban relacionados con ésta; fue así como surgieron encuestas especializadas sobre el tema y se crearon foros y congresos a nivel internacional para monitorear dichos indicadores (Veenhoven, 1996).
Desde esta perspectiva materialista, un aumento en la calidad de vida tendrá como consecuencia incrementos en el nivel de satisfacción; sin embargo, existen teorías que dicen que esto será sólo temporal, o bien, no tendrá algún efecto debido a que la felicidad depende de otros factores. Por esta razón, hasta hace algunas décadas, el tema de la felicidad ha dejado de estar tan fuertemente relacionado con el bienestar material y ha sido motivo de reflexión, incluso desde el propio gobierno, al cuestionarse si las metas de crecimiento económico o las políticas públicas de combate a la pobreza, entre otros, son suficientes para asegurar el progreso de las sociedades (Veenhoven, 1996). En este sentido, el bienestar de las personas ha pasado de ser una construcción teórica con variables aproximadas a ser un concepto más vivencial al preguntarles directamente a las personas su nivel de felicidad, método conocido como bienestar subjetivo (Rojas, 2014b).
Ahora, ya no basta crecer económicamente o mejorar la distribución del ingreso, que los niños y jóvenes asistan a la escuela, que los pisos dejen de ser de tierra, etc., también es necesario ver que estas mejoras en la condición de vida, junto con el resto de las políticas públicas, se traduzcan en bienestar a nivel emocional duradero para la población (Stiglitz et al., 2010).
Es así como algunos gobiernos y organismos internacionales han promovido a los indicadores de felicidad o satisfacción con la vida como un elemento adicional para ser considerado dentro del diseño de políticas públicas cada vez más informadas con el fin de que complementen a los indicadores tradicionales, además de que el progreso también sea evaluado con una perspectiva cada vez más humana (Stiglitz et al., 2010).
Dentro de la introducción de los gobiernos a los temas de felicidad destaca el anuncio de rey de Bután en 1972, en el cual se manifiesta que el objetivo del país sería incrementar lo que llamaría felicidad nacional bruta en lugar del crecimiento económico; por otro lado, en el 2008 se formó la Comisión sobre la Medición del Desempeño Económico y el Progreso (Stiglitz et al., 2010), creada por iniciativa del entonces presidente de Francia, Nicolas Sarkozy, para destacar que no se había medido adecuadamente el progreso social al limitarse a utilizar sólo variables económicas, como el producto interno bruto.
Estas acciones se han traducido en la creación de pautas internacionales para su implementación en la política pública y su medición, como la resolución de la Asamblea General de la Organización de las Naciones Unidas La felicidad, hacia un enfoque holístico del desarrollo, donde se establece que ésta es un objetivo humano fundamental (Rojas, 2014a), o el esfuerzo de la Organización para la Cooperación y Desarrollo Económicos (OCDE, 2013), la cual creó una serie de recomendaciones fundamentales para la medición del llamado bienestar subjetivo. Sin embargo, previo a la Comisión, hay antecedentes de diversas encuestas en países como Estados Unidos de América (EE.UU.) o el Reino Unido derivados del interés creciente en estos temas por parte de psicólogos y, después, por economistas.1
Desde la década pasada han cobrado relevancia diversos estudios que tratan de explicar cuáles son las causas que motivan a una persona a evaluar cierto nivel de satisfacción con su vida, es decir, a encontrar los determinantes de la felicidad. Entre las variables más recurridas se encuentra el ingreso, sin embargo, la variable en sí misma puede presentar algún sesgo provocado por la imprecisión al ser reportada. Uno de estos trabajos consiste en un estudio de panel hecho por Powdthavee (2010) para la población del Reino Unido, el cual relaciona el logaritmo del ingreso real per cápita como variable que explica el nivel de satisfacción con la vida y estudia el sesgo que puede tener información —más o menos— precisa sobre los ingresos del hogar por medio de la proporción de personas que muestran los recibos de pago respecto de quienes no lo hacen, encontrando una relación significativa del ingreso, pero insignificante en valor absoluto.
Otras investigaciones han encontrado en el consumo un determinante más contiguo al nivel de felicidad de las personas. Entre éstas, podemos destacar la de DeLeire y Kalil (2010) para población de edad avanzada en EE.UU., quienes encuentran que, particularmente, el gasto dedicado al ocio tiene una relación con altos niveles de felicidad, o bien, el trabajo de Winkelmann (2012) que, además del consumo propio del hogar, introduce el efecto que puede provocar el consumo conspicuo de los vecinos y, con ello, el efecto que éste produce en la felicidad del sujeto de estudio, encontrando que las personas que viven en localidades con alta presencia de automóviles lujosos2 tienen menores niveles de felicidad.
En México comenzaron a surgir estudios cuantitativos de bienestar subjetivo en la presente década. Las primeras investigaciones aplicadas se llevaron a cabo por medio de encuestas pequeñas para zonas específicas o para un tipo de personas en particular, como la que se recabó en el estado de México, Puebla, Veracruz de Ignacio de la Llave y Ciudad de México en el 2000 por la Universidad de Puebla (Rojas, 2005) o para Sonora por el Centro de Alimentación y Desarrollo en el mismo año (Tanori, 2000). También, se puede encontrar un estudio sobre una encuesta para jóvenes universitarios en el Noreste de México en el 2001 (Vera Noriega, 2001) o para población indígena en Sinaloa en el 2010 (Solís y Zavaleta, 2010).
Por otra parte, con representatividad nacional, se tiene la Encuesta Nacional sobre Niveles de Vida realizada por el Centro de Investigación y Docencia Económicas (CIDE) junto con la Universidad Iberoamericana con datos longitudinales, la cual se levantó desde el 2002 (Peñafiel, 2011), donde se preguntó acerca de la situación emocional reciente del entrevistado, cuestiones de victimización, demografía, natalidad, salud, ingresos y gastos. De manera más reciente, la encuestadora Mitofsky recabó en el 2008 información acerca de la perspectiva subjetiva de diversos ámbitos de bienestar con una muestra de 1 200 personas en la República Mexicana.
Sin embargo, fue en el 2012 cuando el Instituto Nacional de Estadística y Geografía (INEGI) realizó, por primera vez, una encuesta con suficiente capacidad en muestra para estudiar el bienestar subjetivo de manera más robusta para la población a niveles nacional y estatal, así como por localidad, para diferentes poblaciones. Desde esa fecha se ha podido estudiar al bienestar subjetivo de la población en México desde una perspectiva microeconómica y con diversas ópticas, como su relación con el ingreso (Rojas, 2014a) o de riesgos sociales (Millán y Mancini, 2014).
Respecto al tema de consumo, existe un estudio que relaciona el nivel agregado de gasto agrupado en quintiles y el de satisfacción con la vida por medio del Modelo Logístico Ordinal, donde se encuentra una relación positiva acentuada entre los niveles más altos (quintil IV y V de gasto) respecto al más bajo (quintil I) (Leyva et al., 2016).
Planteamiento del problema
Los diferentes estudios de la felicidad alrededor del mundo se han caracterizado, en su mayoría, por abordarla empíricamente bajo tres perspectivas:
1. Comparaciones entre países de los niveles de satisfacción con la vida en relación con sus niveles de pobreza.
2. Su comportamiento en el tiempo.
3. Relaciones entre las variables de percepción de la satisfacción y variables objetivas o características psicológicas de las personas.
De las distintas investigaciones hechas en muchas partes del planeta se ha aprendido de manera general que hay una especie de comportamiento tipo U entre el nivel de satisfacción con la vida y la edad, y que existe una relación positiva entre el nivel de bienestar y la educación, el matrimonio y el buen estado de salud; también, que hay una correlación entre variables felicidad y satisfacción con la vida o que la felicidad es sensible a eventos de corto plazo, como una noticia, o bien, que la convivencia familiar, de amistad o participación social favorece a la felicidad.
Sin embargo, uno de los hallazgos más importantes encontrados de manera general en estudios en distintas naciones es lo que se conoce como la paradoja de Easterlin donde, a partir de cierto nivel de ingreso, no se presenta una relación entre el ingreso y el bienestar de las personas (Easterlin, 1974).
A pesar de que la variable más relacionada con el bienestar es el nivel de ingreso, existen aún manifestaciones acerca de sus posibles inconvenientes, sobre todo asociadas con su medición. Es una variable que difícilmente elige un individuo, pues está dado por una serie de circunstancias y condiciones que son ajenas a las propias personas analizadas. Por esta razón, algunos estudios han considerado que el gasto puede dar una perspectiva distinta de las causas que otorgan felicidad, el cual es una variable mucho más próxima a la elección de los individuos, otorgándoles empoderamiento sobre su estilo de vida, que se puede manifestar por medio de las decisiones cotidianas que hacen las personas para satisfacer sus necesidades con base en sus gustos y preferencias. Por ello, resulta interesante conocer si estas elecciones en su estilo de vida abonan a su visión personal acerca del nivel de satisfacción con su vida.
En México ya se estudia el fenómeno de la felicidad, pero el tema del bienestar subjetivo sigue siendo nuevo y poco conocido aún en el país. Hace falta más investigación sobre los factores que van más allá de las características personales del individuo. Es necesario reunir una serie de tiempo suficiente para analizar la evolución o posibles patrones estacionales o su relación con variables económicas o de percepción. También, se requiere investigar el grado en que las necesidades psicológicas influyen en la evaluación del bienestar, como: la pertenencia, el sentido de la vida o el reconocimiento. En este contexto, nuestra investigación pretende aportar al conocimiento de las causas que producen bienestar a la sociedad mexicana, y profundiza en el análisis de la relación entre el consumo y el nivel de satisfacción con la vida, pasando del nivel general de gasto al detalle en el consumo de acuerdo con sus finalidades.
A continuación, se muestra la metodología empleada usualmente para tratar datos categóricos y el método utilizado; después, se da un panorama tanto sociodemográfico de los entrevistados como de las principales variables sobre percepción de bienestar y niveles de gasto por rubros; por último, se presentan los resultados del modelo estimado y las conclusiones.
Metodología
Según la oficina de estadística del Reino Unido, las mediciones de felicidad o satisfacción con la vida deben cumplir con tener rigor teórico, ser relevantes para la política y ser empíricamente robustas. Estos requisitos los cumplen tres tipos de medidas de la felicidad, que son:
1. Indicadores objetivos. Son los relacionados con un enfoque de necesidades y derechos que hacen que una persona pueda desarrollarse en todo su potencial, como acceso a salud o a educación.
2. Elementos elegidos para alcanzar la satisfacción. El incremento del ingreso va a provocar mayor satisfacción, ceteris paribus, ya que es el individuo el que selecciona sus propios satisfactores.
3. Bienestar subjetivo. Las personas dan una valoración propia del nivel de felicidad en el que viven ya sea de manera general o con algunos aspectos particulares de su vida.
Las medidas de bienestar subjetivo cubren ciertos aspectos, que son la evaluación de la felicidad o satisfacción con la vida por medio de preguntas en una escala del 0 al 10, del bienestar como un balance entre placer y dolor de circunstancias particulares y, finalmente, del estado anímico o nivel de fortaleza de las personas (Dolan y Metcalfe, 2011). En la bibliografía consultada, se asume la variable satisfacción con la vida como una variable sobre el concepto felicidad, ya que cuando el entrevistado contesta se remonta a distintos tiempos y circunstancias de la vida y no sólo al momento actual de la entrevista, además de que, tanto para algunos países como para México, la valoración de la felicidad y la satisfacción con la vida medidas en la misma escala están fuertemente correlacionadas y no presentan grandes discrepancias con otras variables (Leyva et al., 2016; Dolan y Metcalfe, 2011). Por esta razón, se tomará como la variable de interés para ser explicada en el trabajo. Existen tres características que podemos destacar sobre los datos de satisfacción con la vida:
1. Es una variable categórica. Las personas pueden evaluar su satisfacción con la vida limitado a 11 posibles opciones. En este sentido, lo que interesa para una variable de este tipo no es un valor medio, como ocurre cuando tenemos una aleatoria continua, sino una estimación de la probabilidad con la que una persona evalúa cierto nivel de satisfacción (π1, π2,…, π11) y que la suma de todas las probabilidades sea 1.
Así, la probabilidad de que una persona (n1) elija algún nivel de satisfacción, independientemente de lo que conteste una persona distinta (nj) en otro hogar se puede representar como una multinomial:
donde cada marginal, o nivel en particular, se distribuye de manera binomial.
2. Las opciones de respuesta tienen un orden ascendente. Las categorías de la variable de interés cuentan con un significado relativo, es decir, los valores menores son peores que las categorías más altas. Tomar esta característica en cuenta nos permite obtener información adicional para estimar de mejor manera las probabilidades de cada elección.
3. El grueso de las personas contestó un nivel de satisfacción entre 8, 9 ó 10 (69.2%), como se muestra en la gráfica 1.
Dado que el interés de este trabajo es el de estimar probabilidades condicionales, es decir, la probabilidad de que una persona elija una categoría dado un conjunto de características personales; se descartan los modelos de regresión lineal por mínimos cuadrados ordinarios, ya que presentan diversos problemas en su estimación (Medina, 2003), como: los valores estimados que pueden quedar fuera del rango de 0 y 1; la perturbación aleatoria puede no seguir una distribución normal; y las dificultades de heterocedasticidad, el coeficiente de determinación está subestimado y no se aprecian incrementos marginales de probabilidad al relacionarse linealmente la probabilidad y los valores de x.
Los modelos usualmente empleados para estimación de variables con estas características son los de regresión logística acumulativa (conocidos también como modelos logísticos ordinales), que constituyen un caso específico de los modelos lineales generalizados (McCullagh y Nelder, 1989), en los cuales no se limita que la variable aleatoria tenga un comportamiento normal, sino que el mecanismo generador de los datos puede ser de tipo exponencial, como es nuestro caso (ver Anexo C).
Adicionalmente, se empleó el Modelo Logístico Multinomial, cuyas estimaciones no corresponden a la probabilidad acumulada, sino a la que tiene un individuo de seleccionar una categoría en particular respecto a alguna categoría base, es decir, que no considera la característica ordinal de las variables. De este modo, los coeficientes estimados no son comunes para todas las categorías, sino que hay un estimador para cada una.
Datos
A lo largo del 2012, el INEGI levantó, por primera vez, la Encuesta Nacional de Gastos de los Hogares (ENGASTO), que recoge datos, a nivel nacional y con corte urbano y rural, de los gastos individual y para las necesidades comunes del hogar, además de información sociodemográfica, bienes propiedad de éste y características de las viviendas. El consumo de los hogares se obtuvo por medio de un cuadernillo que se le entregó al administrador de los gastos comunes del hogar durante 14 días, una libreta individual para cada integrante de éste y tres cuestionarios para retomar los gastos en bienes de consumo poco frecuente, con recordatorio de hasta un año al día de la entrevista.
La muestra de la ENGASTO fue extraída por métodos probabilísticos, con diseño bietápico, estratificado y por conglomerados, así como con representatividad a niveles nacional y entidad federativa, así como por localidades urbanas y rurales.
Adicionalmente, como una prueba piloto, en el primer trimestre del mismo año se levantó el Módulo de Bienestar Autorreportado (BIARE), donde se preguntó sobre la percepción que tienen las personas acerca de su nivel de satisfacción con la vida y acontecimientos adversos, entre otros aspectos del bienestar subjetivo de la persona seleccionada. El informante seleccionado para contestar el cuestionario del BIARE fue quien tuviera la fecha más próxima a cumplir años de entre personas de 18 a 70 años de edad.
Se entregó un cuestionario que constaba del autollenado de 67 preguntas sobre la percepción de su situación personal y familiar, opinión política del país, así como de acontecimientos a lo largo de su vida, entre otros temas. La pregunta de satisfacción con la vida fue de autovaloración en escala de 0 al 10, donde 0 es nada satisfecho y 10, muy satisfecho con su vida.
En total, en la encuesta se estimaron 70.7 millones de personas entre este grupo etario, cuya edad promedio era de 38 años, de las cuales 52% correspondió a mujeres y 47%, a hombres (ver cuadro 1). De estas personas, 66% estaban viviendo en unión libre o eran casadas; 24%, solteras; y 9.6% se encontraban separadas, viudas o divorciadas. Por su parte, 40% de los encuestados eran los jefes del hogar; 29%, esposas(os) o compañeras(os); 22.5%, hijos; y 8.4% tenían otro parentesco o no tenían parentesco con el jefe del hogar.
De los entrevistados, 52.5% pertenecía a un estrato socioeconómico medio bajo; 21.5%, al bajo; 19.5%, al medio alto; y 6.4%, al alto. Finalmente, 79% vivía en localidades de 2 500 habitantes y más.
En relación con la satisfacción con su vida (ver cuadro 2), 47% se encontraba satisfecho con su vida (con valoraciones de 9 y 10 en la escala); 36% se sentía moderadamente satisfecho (con valores de 7 y 8); 12%, poco satisfecho (con 5 y 6); y 5%, insatisfecho con su vida (con menos de 4 en la escala).
En una situación similar se registró el nivel de felicidad que sintió la persona el día anterior a la entrevista, es decir, la mayor proporción de personas (43.7%) se encontró en la categoría más alta y 8.5%, en la menor.
Respecto a la percepción sobre la situación económica de las personas, 67% estuvo entre las categorías 5 y 8 de la autoevaluación. Adicionalmente, 20% respondió que ha pedido prestado para comprar alimentos o para despensa en los últimos tres meses.
Las variables numéricas que se utilizaron corresponden al nivel del gasto ajustado por unidad de consumo equivalente (UCE), que es una escala de equivalencia utilizada por organismos internacionales, como la Comisión Económica para América Latina y el Caribe (CEPAL) o la OCDE (2013), en la que se toma en consideración que los hogares están formados demográficamente de distintas maneras y que no todos los integrantes consumen de la misma manera en un hogar, por lo que hay economías de escala en el consumo, así como también bienes públicos al interior de cada hogar (ver cuadro 3). De este modo se mejora el indicador usual de consumo per cápita que, si bien ayuda a hacer más comparable el gasto entre hogares de diferentes tamaños, no toma en consideración que un adulto no consume lo mismo que un niño o, incluso, que otro adulto o que da lo mismo que una persona viva sola, en pareja o agrupada en familia extendida haciendo más comparable el nivel de consumo entre hogares (Rojas, 2014b).
Si bien hay distintas escalas de equivalencia, en este trabajo se empleó la escala de la OCDE (2013), que es la utilizada en los resultados de la encuesta, en la cual se da el valor de 1 al primer adulto, 0.7 por cada adulto adicional y 0.5 a los menores de 18 años de edad.
Modelo
De acuerdo con la revisión bibliográfica del tema, se encontró como variable más recurrida la de nivel de ingreso, pero dentro de las que al consumo se refieren, hacen hincapié en gastos de consumo suntuario o en actividades sociales. En este sentido se utilizaron para el modelo (ver cuadro 5 del Anexo A):
• Grado de satisfacción con la vida (gr_satis). Consiste en una agrupación del grado de satisfacción con la vida reportado por las personas. El captado de origen se clasificó en cuatro niveles:3 1) insatisfecho, cuando la persona contestó entre 0 y 4; 2) poco satisfecho, cuando contestó 5 ó 6; 3) moderadamente satisfecho, con grados de respuesta entre 7 u 8; y 4) satisfecho, cuando contestó 9 ó 10.
Se decidió agrupar las categorías debido a que no se considera relevante en este trabajo identificar precisamente si la persona está en el nivel 1 de felicidad o 2 sino, en términos más generales, si está insatisfecha o no, además de que no se puede probar de manera estricta si la distancia entre escoger 1 ó 2 es la misma que la que se tiene entre elegir 3 ó 4 o cualquier otro nivel.
• Sexo (sexo). Clasificación de la persona en hombre o mujer, donde hombre es 0 y mujer, 1.
• Edad (edad). Edad de las personas al día de la entrevista.
• Edad al cuadrado (edad_cuadrado). Esta variable pretende modelar el efecto que tiene la felicidad con el incremento de la edad, que será incluida de acuerdo con el modelo de Winkelmann.
• Situación conyugal (edo.conyugal). Dice si la persona es 1) soltera, 2) casada o viven en pareja, o bien, 3) divorciada o viuda.
• Actividad económica (actividad). En ésta se clasifica a las personas de acuerdo con:
1) se encuentran ocupadas,
2) están desocupadas,
3) son pensionadas o se dedican a los quehaceres del hogar,
4) son estudiantes
5) si tienen alguna discapacidad u otra situación distinta a las anteriores.
• ¿Qué tan feliz se sintió el día de ayer? (feliz). La variable original es ordinal, en la que 0 significa que no se sintió feliz y 10 que se sintió muy feliz. Del mismo modo, y por las mismas razones que con la satisfacción con la vida, se agruparon los niveles de la variable original de la felicidad en cuatro grupos: 1) no feliz, si la persona evaluó su felicidad el día anterior entre 0 y 4; 2) poco feliz, si contestó 5 ó 6; 3) moderadamente feliz, si respondió entre 7 y 8; y 4) feliz, si contestó 9 ó 10. El nivel de felicidad del día anterior fue elegido ya que para Diener (2006), la preponderancia de un estado de ánimo positivo en las personas repercutirá en un mayor bienestar subjetivo (Gómez y Villegas, 2007); adicionalmente, resultó ser una variable destacada en un ejercicio que se llevó a cabo mediante la técnica de árboles de clasificación.4
• ¿Qué tan satisfecho se siente con su situación económica? (sasf.dinero). Debido a que no se cuenta con información de ingresos, se incluyó la percepción sobre su situación económica, donde 0 es nada satisfecho y 10, muy satisfecho, en su nivel original, que por su importancia se desea obtener el mayor detalle posible. Esta variable se ha incluido porque no se cuenta con una de nivel de ingresos del hogar y, según diversos trabajos que se han mencionado anteriormente, es una característica con influencia en la satisfacción de las personas.
• En los últimos tres meses, ¿ha pedido prestado para comprar alimentos o despensa? (prestado). Se incluyó como una variable más realista acerca de situaciones de necesidades más urgentes de ingreso, y pretende apoyar más objetivamente sobre la situación económica del entrevistado. La categoría 0 indica que sí ha pedido prestado recursos y 1 que no. Se ha incluido para complementar la percepción de la situación económica de las personas como una variable de una muy mala situación económica al momento de la entrevista (Leyva et al., 2016).
• Rubros de gasto anual ajustado por unidades de consumo equivalente. De acuerdo con el trabajo de DeLeire y Kalil (2010), éstos se agruparon por sus finalidades utilizando la Clasificación de Consumo Individual por Finalidades (CCIF).
A diferencia de estos autores, el logaritmo del gasto fue ajustado por las UCE de cada hogar para, posteriormente, agruparse en cuatro rangos formados de acuerdo con la desviación estándar respecto a la media de la distribución de cada grupo de gasto.
Se decidió agrupar a las variables de gasto ya que, en general, presentan diferencias marginales en los montos en algunos rangos de gasto, así como presencia de valores extremos. Por lo anterior, y con el fin de que las estimaciones no se vieran afectadas por estas causas y para mejorar los estadísticos de bondad de ajuste y proporción de predicciones correctas del modelo, se tomó la decisión de agrupar en rangos construidos a partir de las características propias de cada variable de gasto:
• Rangos del logaritmo del gasto ajustado por UCE en rubros asociados con el ocio (ocio_gpo). Por ejemplo, paquetes turísticos; periódicos; libros; servicios deportivos, de recreación y culturales; artículos duraderos para recreación (carros de golf, equipo de alpinismo, piscinas inflables, instrumentos musicales, mesas de billar, etcétera). Dada la distribución de la variable, los rangos de agrupación del logaritmo del ingreso se formaron como se muestra en la gráfica 2.
• Rangos del logaritmo del gasto ajustado por UCE en bienes durables y vehículos (durables_gpo). En la adquisición de vehículos de cualquier tipo, estufas, licuadoras, batidoras y demás aparatos grandes para el hogar (ver gráfica 3).
• Rangos del logaritmo del gasto ajustado por UCE en cuidados personales, ropa y calzado (ropa_gpo). Por ejemplo, servicios en salones de belleza, secadoras, planchas de cabello, jabón, crema, tintes, gel, etc.; efectos personales (bolsas, carteras, lentes, paraguas); zapatos y ropa (ver gráfica 4).
• Rangos del logaritmo del gasto ajustado por UCE comida para consumirse dentro de la casa (cdentro_gpo). Adquisición de leche, huevo, pan, condimentos, frutas, verduras, entre otros alimentos (ver gráfica 5).
• Rangos del logaritmo del gasto ajustado por UCE en comida fuera de la casa (cfuera_gpo). Asistir a restaurantes, cafeterías, cines, etcétera (ver gráfica 6).
• Rangos del logaritmo del gasto ajustado por UCE en vivienda, agua, gas, teléfono, cable, internet para la casa (artcasa_gpo). Como se observa en la gráfica 7.
• Rangos del logaritmo del gasto ajustado por UCE en gasolina y refacciones, los gastos relacionados al uso de vehículo (vehiculo_gpo). Como se muestra en la gráfica 8.
• Rangos del logaritmo del gasto ajustado por UCE en consumo de carne (carne_gpo) de cualquier especie. Este rubro tan particular se eligió debido a que presenta de manera individual una relación relativamente más importante con la satisfacción con la vida, en comparación con el resto de los productos o, incluso, algunas ramas o clases; visto mediante una prueba de covarianza individual (ver gráfica 9).
Con la finalidad de facilitar la interpretación de los resultados, en el cuadro 4 se muestran los rangos en unidades monetarias anuales que corresponden a cada una de las categorías de las variables de gasto transformadas que se mencionaron anteriormente. Asimismo, en el cuadro 5 se describen las variables y sus categorías que son empleadas en el modelo y en el cuadro 6 se muestra el número de personas que se encuentran según el rango de gasto agrupado y su porcentaje respecto al total.
Con el empleo de estas variables y los resultados que se han obtenido con otros países, en este trabajo se probarán las siguientes hipótesis:
• Hipótesis 1. El gasto influye en el nivel de satisfacción de la vida de las personas. De acuerdo con investigaciones similares —como el de DeLeire y Kalil (2010)—, en otras sociedades distintas a la mexicana, el gasto tiene cierta influencia en el nivel de satisfacción con la vida que, aunque no es sustancial, existe.
• Hipótesis 2. El gasto empleado en bienes que están asociados con la comodidad para la vida diaria tiene una mayor influencia en la satisfacción con la vida de las personas. En el mismo trabajo se muestra que los gastos en automóviles tienen una importancia mayor que la de otros productos; sin embargo, estos resultados fueron obtenidos para población de 65 años y más de edad que tuvo a lo largo de su vida más oportunidades de adquirir un bien que es relativamente más costoso que otros bienes durables por lo común, mientras que en esta investigación se incluye la población de 18 a 70 años, por lo que se probará que otros bienes que también pueden reportar comodidad influyen en el nivel de satisfacción con la vida.
Como hipótesis adicionales, se precisa corroborar algunos resultados que se han obtenido en trabajos anteriores, tanto para México como para otros países, como las siguientes dos:
• Hipótesis 3. El aumento de la edad reporta mayor nivel de satisfacción con la vida.
• Hipótesis 4. Las personas que viven en pareja reportan mayor nivel de satisfacción con la vida.
Resultados
Como ya se vio antes, para probar las hipótesis, se emplearán dos técnicas para modelar las variables cualitativas: los modelos logísticos Ordinal y Multinomial.
Modelo Logístico Ordinal
En este caso, el parámetro estimado β es común para todas las categorías, pues la probabilidad estimada es la que se obtiene de alcanzar el valor máximo de la categoría ordinal ascendente. Este supuesto se debe probar mediante la prueba de líneas paralelas (ver Anexo C).
En este sentido, se empleó el nivel 4 de satisfacción con la vida, es decir satisfecho con la vida, que —como se mencionó— es la categoría natural elegida como base por tratarse de una probabilidad acumulada. La especificación del modelo se expresa del siguiente modo:
En el cuadro 7 se muestran los resultados de las estimaciones obtenidas de este modelo; en la primera columna se observan los estimadores de los coeficientes β, en la quinta se presentan los Odd ratios (exp( β )) y en la octava, el p-valor o nivel de significancia a 95 por ciento.
Para evaluar el nivel de significancia de las covariables, se empleó el test de Wald (ver Anexo C). Derivado de los resultados del contraste de hipótesis de dicha prueba, resulta que en cuanto a las variables socioeconómicas, resultaron tener significancia estadística actividad económica y edad; respecto a las de gasto, sólo el rubro de uso de vehículo mostró tener significancia estadística y de las variables sobre percepción acerca de algunos aspectos particulares de la vida, únicamente: qué tan feliz se sintió la persona el día anterior a la entrevista y qué tan satisfecho está con su situación económica.
Posterior a realizar el modelo simplificado, es decir, en el que se encuentran sólo las variables que aportan información para explicar el nivel de satisfacción con la vida (cuadro 8 del Anexo B) se desprende que el estar pensionado o dedicarse a los quehaceres del hogar, o bien ser estudiante, proporciona más posibilidades de estar satisfechos con su vida que si se tiene una discapacidad en 1.4 y 1.5 veces, respectivamente. Por último, la variable de edad indica que el aumento de la edad disminuye la posibilidad de que se conteste que se está satisfecho con la vida en 1.02 veces (1/.982).
Por su parte, gastar dentro del menor rango, es decir, entre 0 y 321.54 pesos anuales por UCE en bienes relacionados con el uso de vehículo reduce la posibilidad de estar satisfecho con la vida en 1.2 veces; estar dentro del segundo rango (321.55 y 1 382.02) reduce la posibilidad en 1.1 veces y estar en el tercero (entre 1 382.03 y 5 931.41) disminuye en 1.2 veces respecto a gastar dentro del mayor rango de gasto de más de 5 931.42 pesos anuales por UCE.
Por último, se observa claramente que las personas con mayor felicidad el día anterior a la entrevista tienen más posibilidades de sentirse satisfechas con la vida, de la misma manera que sentirse bien con su situación económica muestra una relación positiva con el nivel de satisfacción con la vida.
Específicamente, si las personas no se encuentran felices el día anterior a la entrevista tienen 5.6 veces menos posibilidades de responder que están satisfechas con su vida; si son poco felices, 4.5 veces menos; y si están moderadamente felices, 3.5 veces menos. Por su parte, si los individuos están en un nivel de 1 con su situación económica, tienen 6.3 veces menos posibilidades de estar satisfechos con su vida.
Como puede observarse de los resultados anteriores, el gasto tiene una influencia en el nivel de satisfacción con la vida muy pequeña comparado con otros factores sobre percepción de aspectos diferentes de la vida, específicamente el estado de ánimo reciente a responder la entrevista. Asimismo, aunque en su conjunto las variables independientes empleadas en el modelo ajustado (ver Anexo C) explican entre 28.9 y 32.3% su satisfacción con la vida (cuadro 9), según el estadístico de Pseudo R cuadrado Cox y Snell y Nagelkerke, respectivamente, también se obtienen 57.9% de predicciones correctas ver (ver cuadro 10).
A pesar de estos resultados, se debe probar el supuesto que asumimos con anterioridad, en el cual las β estimadas son comunes para todas las categorías. Para probarlo, se emplea el test de líneas paralelas o paralelismo, en el cual contrastamos que en lo único que discrepan las distintas curvas que se generan con cada categoría es en el intercepto (ver Anexo C). Del resultado de la prueba de paralelismo, observamos que se rechaza la hipótesis nula en la que los coeficientes son comunes para todos los niveles de satisfacción con la vida (ver cuadro 11); por lo tanto, concluimos que no es posible generalizar los resultados obtenidos del modelo para una persona que se encuentra poco satisfecha, moderadamente satisfecha o satisfecha. En estos casos, es conveniente realizar un modelo multinomial y así obtener coeficientes para cada nivel de satisfacción con la vida.
Modelo Logístico Multinomial
Éste se utilizó dado que no se puede generalizar o hacer inferencia con el Ordinal para todos los niveles de satisfacción con la vida. La categoría base fue insatisfecho con la vida, que es el nivel 1 de la clasificación, y la especificación del modelo se expresa del siguiente modo:
Como se mencionó anteriormente, este modelo arroja estimaciones de los parámetros β para cada categoría o nivel de satisfacción con la vida. En el cuadro 12 del Anexo B se muestran los resultados de la estimación de los logits para cada categoría.
En las columnas 3, 6 y 9 del mismo cuadro se presentan las categorías para cada nivel de satisfacción, que son estadísticamente significativas individualmente según el estadístico Wald.
En el caso de las personas que están poco satisfechas, las variables que son significativas para su determinación son los sentimientos de felicidad el día anterior a la entrevista, el sexo y tanto el gasto en uso de vehículos como en ocio. Ninguna otra variable hace una marcada diferencia entre estar poco satisfecho respecto a estar insatisfecho con la vida.
Según los signos de los logits de estas variables en el modelo simplificado del cuadro 13, para las personas que se sintieron poco satisfechas, ser hombre disminuye en 1.4 veces (1/Odd ratio = 1/0.704) la posibilidad de estar en este nivel; estar poco feliz o moderadamente feliz el día anterior al llenado del cuestionario incrementa la posibilidad de estar poco satisfecho con la vida en 2 y 2.8 veces en relación con estar insatisfecho con la vida.
Respecto a los rubros de gasto, el encontrarse en el menor rango, es decir, gastar hasta 321.54 pesos al año por UCE en uso de vehículo aumenta la posibilidad de estar insatisfecho con la vida en 2.8 veces, mientras que en el de ocio, tras realizar el modelo simplificado, ya no explica las posibilidades de encontrarse poco satisfecho con la vida.
En el caso de las personas que están moderadamente satisfechas con su vida, ser mujer aumenta en 1.5 veces las posibilidades respecto a estar insatisfecha con la vida que, si se es hombre, del mismo modo que estar en los niveles bajos (0 y 1) de la satisfacción con la situación económica y no estar feliz o poco feliz el día anterior a la entrevista.
En cuanto a las variables de gasto, con el modelo simplificado, el encontrarse en los tres primeros rangos en uso de vehículo reporta mayores posibilidades de estar insatisfecho con la vida a moderadamente satisfecho: en el caso de gastar menos de 321.54 pesos al año por UCE, en 3.3 veces; entre 321.54 y 1 382.02, en 2 veces; y gastar entre 1 382.03 y 5 931.41, en 2.2 veces.
Por su parte, gastar entre 219.98 y 991.35 pesos al año por UCE en ocio también reduce la posibilidad de estar moderadamente satisfecho a insatisfecho con la vida en 1.8 veces.
Por último, si la persona se encuentra satisfecha con su vida, es decir, que contestara con un grado de 9 ó 10 en la variable original, dentro de las características personales tenemos que si una persona es estudiante tiene 3.2 veces más posibilidades de estar satisfecha con su vida a estar insatisfecha; si es ocupada, 2.4 veces; y si tiene pareja se incrementa 2.6 veces; manteniendo todo lo demás constante.
Por su parte, entre mejor haya sido el día anterior al llenado del cuestionario, en términos de felicidad, se tendrán menores posibilidades de contestar que se está insatisfecho con la vida. En detalle, si una persona no fue feliz el día anterior a la entrevista es 40 veces más posible que esté insatisfecha a que esté satisfecha con su vida, 13.3 veces más posible si fue poco feliz y 2.5 veces más si estuvo moderadamente feliz. Si es hombre, tiene 1.4 veces menos posibilidades de estar satisfecho con su vida.
En tanto, las personas que están en niveles bajos (menor a 7) de satisfacción con su situación económica y si tuvieron que pedir prestado en los últimos tres meses para comer, tienen más posibilidades de estar insatisfechas a estar satisfechas; en este último caso es 1.4 veces.
En el gasto en uso de vehículo, si las personas se encuentran en uno de los tres primeros rangos, también tienen más posibilidades de estar insatisfechas a satisfechas.
En el cuadro 16 se muestran los Odd ratios de los rubros con significancia estadística en algún rango para cualquier nivel de satisfacción con la vida, pero tomando como base el valor menor. Lo anterior, para observar con más claridad el impacto del incremento del gasto en la felicidad.
En este cuadro se observa que el incremento del gasto en el uso de vehículos aumenta la posibilidad de estar moderadamente satisfecho o satisfecho con la vida, en todos los rangos, sobre todo en el más alto, en el que incrementa en más de tres veces la posibilidad. Por su parte, sólo los dos rangos más elevados de gasto en adquisición de bienes durables incrementan en 1.4 y 1.5 veces estar moderadamente satisfecho o satisfecho, respectivamente.
Por otro lado, al realizar el modelo simplificado, la edad y la edad al cuadrado no presentaron significancia estadística en el nivel más alto de satisfacción para explicar el porqué las personas se sienten satisfechas con su vida.
En suma, del Modelo Logístico Multinomial destacan cuatro variables que pueden hacer una marcada diferencia entre estar satisfecho a estar insatisfecho con la vida, que en orden de importancia son: haber tenido un buen estado de ánimo recientemente al contestar el cuestionario (1), estar satisfecho con la situación económica (2) y tener rangos relativamente altos en el consumo que implique uso de vehículo (3) y en bienes durables (4), es decir, gastos asociados a cierta comodidad, mientras que con menor implicación se encuentran ser estudiante (1), estar ocupado en una actividad económica (2), ser mujer (3) y no haber tenido que pedir prestado para comer (5).
Los estadísticos de bondad de ajuste del modelo Pseudo R cuadrado de Cox y Snell y Nagelkerke presentan valores de 0.361 y 0.404, respectivamente (del cuadro 14 del Anexo B), y podemos decir que las variables empleadas en el modelo explican entre 36.1 y 40.4% a la satisfacción con la vida (ver Anexo C).
En cuanto a la calidad de las predicciones con este modelo, se observa en el cuadro 15 del Anexo B que, en términos generales, se obtiene 60.94% de predicciones correctas, sin embargo, su calidad es muy diferente según el nivel de satisfacción que se haya estimado.
Individualmente, el nivel más alto de la variable explicada, es decir satisfecho con la vida, tiene un porcentaje de predicciones correctas de 73.5 (24 594 913 casos correctamente predichos de 33 477 334 observados en la variable original). Este resultado es importante, ya que tenemos un porcentaje elevado de aciertos para una categoría que concentra 47.3% de los casos.
El nivel moderadamente satisfecho tiene 59.5% de predicciones correctas con 15 200 416 casos correctamente predichos de 25 544 882 observados. Aunque el porcentaje de aciertos en la clasificación es mucho menor que para las personas que se sienten satisfechas con su vida, podemos decir que es una tasa de aciertos alta para un porcentaje elevado de casos (36.1).
El nivel de poco satisfecho tiene un porcentaje de 29.4 al predecir de manera correcta 2 458 775 casos de 8 376 055 observados.
Finalmente, en el caso de las personas insatisfechas con su vida, mostraron un porcentaje de 26 de casos correctamente clasificados con 878 063 predichos de 3 378 475 observados.
Conclusiones
El estudio numérico de la felicidad a nivel mundial mediante el bienestar subjetivo comenzó hace algunas décadas; sin embargo, la mayoría de las investigaciones en la materia encuentran en el ingreso una de las variables más atractivas para relacionarlo con la felicidad empleando para ello diferentes técnicas estadísticas.
En México, el análisis de este tema es aún muy novedoso, y tratar de explicarla con datos reales es todavía muy poco explorado. Aunque comenzaron a surgir estudios, hay muy pocos que relacionan el nivel de gasto con el grado de satisfacción con la vida en el caso mexicano; hasta el momento, no se había llevado a cabo uno que lo hiciera a profundidad estudiando su relación con el mayor detalle posible en los rubros de gasto para, con ello, conocer la influencia que para las personas tiene su decisión de consumo y el monto que decide destinar para satisfacer sus necesidades.
Según los resultados de este trabajo con el Modelo Logístico Multinomial, se observa que son pocos los rubros de gasto que tienen una relación estadísticamente significativa con el nivel de satisfacción con la vida que tienen las personas. Éstos mostraron estar destinados para incrementar la comodidad en la vida de los individuos (como el gasto en ocio, bienes durables y uso de vehículo) y donde presentar menores niveles de gasto disminuía la posibilidad de tener altos niveles de satisfacción con la vida.
En este sentido, podemos decir que las hipótesis de esta investigación se confirman, ya que, si bien el gasto influye en el nivel de satisfacción con la vida, no es cualquier tipo de gasto, sino el que denota elevado nivel de calidad de vida de los entrevistados en términos de comodidad, pues disponer de vehículo, adquirir electrodomésticos —entre otros bienes de larga duración— o, incluso, un vehículo, así como gastar en ocio o recreación, aumentan la posibilidad de tener elevados niveles de satisfacción con la vida. Ello confirma las conclusiones generales obtenidas por DeLeire y Kalil (2010) con un modelo de mínimos cuadrados ordinarios para Estados Unidos de América.
En cuanto a las características personales de los entrevistados, destaca que el ser hombre disminuye las posibilidades de estar satisfecho con la vida. También, sobresale que el ser estudiante se muestra como una característica para reportar el mayor grado de satisfacción con la vida.
Si bien en la encuesta no se contaba con información puntual de ingresos, y al ser una variable recurrente en los estudios similares, la variable de percepción sobre la situación económica, así como haber presentado la necesidad de pedir recursos para comer, arrojaron los efectos esperados, es decir, que si bien la situación económica no es determinante del nivel de felicidad sí influye negativamente en ésta, sobre todo en el nivel de satisfacción de la situación económica, que resultó importante.
Por último, un hallazgo que no se había mostrado en otros modelos revisados en la literatura es que el estado de ánimo reciente tiene una importancia destacada en la determinación del nivel de felicidad de las personas, por lo que, si bien las características personales y el nivel de vida, en términos de consumo, influyen en la felicidad de las personas, mucho influye también tener un buen estado de ánimo recientemente al contestar el cuestionario.
Fuentes
Cañadas Reche, José Luis. Regresión logística. Tratamiento computacional con R. España, Facultad de Ciencias. Universidad de Granada, 2013.
DeLeire, T. y A. Kalil. “Does consumption buy happiness? Evidence from the United States”, en: International Review of Economics, 57(2), 2010, pp. 163-176.
Diener, E. “Guidelines for national indicators of subjective well-being and ill-being”, en: Journal of Happiness Studies, Volumen 7, 2006, pp. 397-404.
Dolan, P. y R. Metcalfe. Measuring subjective wellbeing for public policy: Recommendations on measures. 2011.
Easterlin, R. A. “Does economic growth improve the human lot? Some empirical evidence”, en: Nations and households in economic growth, 89, 1974, pp. 89-125.
Gómez V. y C. Villegas. “Factores predictores del bienestar subjetivo en una muestra colombiana”, en: Revista Latinoamericana de Psicología. Volumen 39, núm. 2, 2007, pp. 311-325.
Leyva, G., A. Bustos y A. M. Romo. “Life Satisfaction and Happiness in Mexico: Correlates and Redundancies”, en: Handbook of Happiness Research in Latin America. Springer Netherlands, 2016, pp. 579-611.
McCullagh, P. y J. Nelder. Generalized linear models. Vol. 37. CRC press, 1989.
Medina, E. Modelos de elección discreta. España, Publicaciones Económicas de la Universidad Autónoma de Madrid, 2003, p. 26.
Millán, R. y F. Mancini. “Riesgos sociales y bienestar subjetivo”, en: Realidad, Datos y Espacio. Revista Internacional de Estadística y Geografía. Vol.5, Núm. 2, mayo-agosto. México, INEGI, 2014, pp. 48-79.
Moreno Díaz, A. Modelos multivariantes para variables ordinales: Aplicaciones en estudios de calidad de servicio. Tesis doctoral. Universidad Politécnica de Madrid, 2001, p. 117.
O’Conell, A. “Logistic Regression Models for Ordinal Response Variables”, en: Sage Publications. Series 07, Number 146, 2006, p. 109.
OCDE. Guidelines on Measuring Subjective Well-being. doi:10.1787/9789264191655-en. 2013.
Jun Shao, B. H. y Palta Mari. “Pseudo- in logistic regression model”, en: Statistica Sinica. 2006, pp. 847-860.
Peñafiel, L. N. R. “Indicadores subjetivos de bienestar y progreso social”, en: Realidad, Datos y Espacio. Revista Internacional de Estadística y Geografía. 2011, pp. 82-95.
Powdthavee, N. “How much does money really matter? Estimating the causal effects of income on happiness”, en: Empirical Economics, 39(1), 2010, pp. 77-92.
Rojas, Mariano. “El bienestar subjetivo en México y su relación con indicadores objetivos”, en: E. Garduño, B. Salinas B. y M. Rojas (eds.). Calidad de vida y bienestar subjetivo en México. 2005, pp. 83-111.
_______ El estudio científico de la felicidad. México, Fondo de Cultura Económica, 2014a.
_______ “Estimación de escalas de equivalencia en México. Un enfoque de bienestar subjetivo”, en: Realidad, Datos y Espacio. Revista Internacional de Estadística y Geografía. Vol.5, Núm. 3, septiembre- diciembre. México, INEGI, 2014b, pp. 4-15.
Solís, J. y G. Zavaleta. Bienestar subjetivo en estudiantes universitarios indígenas: un estudio en la institución intercultural del estado de Sinaloa. 2010.
Stiglitz, J. E., A. Sen y J. P. Fitoussi. Report by the commission on the measurement of economic performance and social progress. Paris: Commission on the Measurement of Economic Performance and Social Progress, 2010.
Tanori Aguilar, B. C. Propiedades psicométricas para medir el bienestar subjetivo. Tesis de licenciatura. Centro de Investigación en Alimentación y Desarrollo, AC, 2000, p. 49.
UCLA: Statistical Consulting Group. What are pseudo R-squareds? 2011. (DE) http://www.ats.ucla.edu/stat/mult_pkg/faq/general/Psuedo_RSquareds.htm consultado el 3 de agosto de 2015.
Veenhoven, R. “The study of life-satisfaction”, en: V. h. W. E. y R. Scherpenzeel. A comparative study of satisfaction with life in Europe. Eotvos University Press, 1996, pp. 11-48.
Vera Noriega, J. A. “Bienestar subjetivo en una muestra de jóvenes universitarios”, en: Revista Intercontinental de Psicología y Educación. 2001.
Winkelmann, R. “Conspicuous consumption and satisfaction”, en: Journal of Economic Psychology, 33(1), 2012, pp. 183-191.
Anexo A
Anexo B
Anexo C
Modelos lineales generalizados (MLG)
En la teoría se asume que los MLG se componen de tres elementos (Moreno Díaz, 2001):
1) Componente aleatoria: en el que se asume que la variable aleatoria Y tiene una distribución de probabilidad con media µ .
2) Componente sistemático: la combinación lineal de las covariables que va a predecir a la variable de interés Y es el predictor lineal .
3) Función de enlace entre 1) y 2): es la que usualmente se denomina como g(*), función de enlace o link, con la que se obtendrán los valores esperados µ = η = g(*) ; es a través de ésta que las covariables ejercerán un efecto sobre el valor esperado Y.
Dentro de estos modelos, y dadas las características enumeradas anteriormente sobre los datos observados en la satisfacción con la vida en la encuesta, se realizarán dos ejercicios: uno considerando la ordinalidad de la variable, es decir, utilizando una función logística acumulativa, y otro modelo sin tomar en cuenta la característica ordinal, o sea, el Modelo Logístico Multinomial.
En ambos modelos se elige una categoría de referencia, tanto si la variable dependiente tiene dos categorías o si tienen más; sin embargo, la forma de estimar las probabilidades y la interpretación de los resultados es diferente.
En el caso de la regresión logística multinomial, la función del modelo está formulada como:
y expresada linealmente:
Los modelos de probabilidad de función logarítmica acumulativa se expresan como:
y expresado en forma lineal:
donde se observa que lo que se modela no es la probabilidad de que X = x, sino su complemento.
En la gráfica 10 se muestra una representación de las dos funciones mencionadas con anterioridad, donde se observa que la ordinal complementaria (cloglog) genera probabilidades que no se distribuyen uniformemente, acercándose al valor de 1 de manera más rápida que el modelo logarítmico (log), donde la velocidad con la que se desplazan las curvas será determinada por el valor de Beta.
Teóricamente, para estimar los modelos logísticos, se maximiza la función de verosimilitud respecto a los parámetros β, aunque en la práctica es a través de la función logarítmica de ésta. Para maximizar el logaritmo de la función de verosimilitud, se hace mediante procedimientos iterativos, como el de Newthon-Raphson, mínimos cuadrados iterativamente reponderados y métodos de optimización general (Cañadas Reche, 2013).
En el caso del modelo acumulativo, se estima un parámetro β para cada variable explicativa, mismo que es compartido por todas las categorías, ya que se asume como común, aunque se debe probar formalmente. Cada parámetro estimado se compara respecto al resto de las categorías de manera acumulada, es decir, que la probabilidad que se obtiene será hasta la categoría j como sigue:
mientras que los estimadores β, derivados de la función multinomial, son respecto a la categoría base:
donde k es la categoría de referencia; usualmente, se elige alguno de los extremos.
Para efectos de interpretación lineal de los parámetros estimados de cada variable independiente X sobre la respuesta Y, se estima el cociente de ventajas u Odds ratios que resulta de elevar al exponente a cada β, esto debido a que las probabilidades de las categorías y las betas de las variables independientes no se corresponden linealmente, por ello, no se pueden interpretar como efectos marginales.
En el caso de la regresión logística ordinal, se representan de la siguiente manera:
mientras que, cuando se trata del Modelo Logístico Multinomial, como:
Del mismo modo, el signo del estimador β no tiene interpretación directa con alguna categoría de la variable Y, sino que el signo se referirá a la categoría base, es decir, en términos de ventajas respecto a la categoría base.
Para evaluar la significancia individual de cada variable independiente, se recurre al contraste de hipótesis de la prueba de Wald (t), que tiene una distribución , cuyos parámetros involucrados son los estimadores máximos verosímiles β y su error estándar () para cada j-ésima covariable X, que se expresa:
con una hipótesis nula de que los estimadores de β no aportan información para estimar a nuestra variable independiente o, en otras palabras, que el modelo con las covariables es igual al modelo nulo y, el caso contrario, es la hipótesis alternativa:
Rechazaremos la hipótesis nula H0 cuando el valor de t se compara con la tabla de la función de distribución x2 con k – 1 grados de libertad a un nivel de significancia de 0.05. Asimismo, que el valor 0 no se encuentre dentro del intervalo de confianza estimado para cada covariable.
En los modelos de mínimos cuadrados ordinarios existe el estadístico R cuadrado, que nos indica la bondad de ajuste del modelo estimado, es decir, que indican la proporción de la varianza de la variable latente o respuesta Y que es explicada por las covariables X (Jun Shao y Palta, 2006) y es una medida que arroja valores entre 0 y 1, donde se espera un valor muy cercano a 1, ya que nos indicaría que las covariables están explicando en gran medida a nuestra variable dependiente; sin embargo, en el caso de los modelos basados en una variable Y categórica, no es posible calcular este indicador de ajuste pues, como se mencionó anteriormente, no se estima ningún valor medio, sino que estamos calculando probabilidades de una categoría en términos de otra.
En el caso de los modelos, se han desarrollado otros estadísticos que se denominan Pseudo R cuadrado, no porque se parezcan en cuanto a su estimación, sino porque también arrojan resultados entre 0 y 1. Uno de ellos es el Pseudo R cuadrado de McFadden, el cual resta de la unidad el cociente entre los estimadores del logaritmo de máxima verosimilitud del modelo con todas las covariables, y el modelo nulo, que es el modelo con intercepto y sin ningún predictor. La relación indica el grado en el que los parámetros del modelo mejoran las predicciones respecto al nulo, donde se observa que cuanto menor sea esta relación, mayor será la mejora del modelo completo respecto a estimar con el nulo y mayor el valor de R2 (UCLA, 2011).
Otro más es el de Cox y Snell, donde la relación de las probabilidades refleja la mejora del modelo total sobre el de intercepción (cuanto menor sea la relación, mayor es la mejora). Se calcula como el cociente entre el estimador de máxima verosimilitud del modelo elevado a la 2/N, ya que al elevar a la raíz enésima del producto, L(M), proporciona una estimación de la probabilidad de cada valor de Y (UCLA, 2011):
Otro es el de Nagelkerke, el cual es un cociente entre la expresión de Cox y Snell y que sería su máximo valor posible (UCLA, 2011). Cuando el modelo prediga perfectamente el resultado el valor de R2 será 1 y cuando sea igual a la predicción del modelo 1 el R2 valdrá 0.
Estas medidas de la calidad del modelo no suelen ser muy similares y, en consecuencia, no son comparables sino, más bien, complementarias, debido a la forma en que tratan los residuales del modelo, que dista mucho del método empleado al minimizar los errores del modelo de mínimos cuadrados ordinarios.
Otra forma de evaluar la calidad del modelo es con el porcentaje de casos correctamente predichos por el modelo que, junto con las tres medidas de R2, ayudaron a elegir el mejor modelo.
Finalmente, y en el caso del Modelo Logístico Ordinal, se asume que las β estimadas son comunes para todas las categorías de la variable dependiente, por lo que podemos hacer inferencia a partir de un único estimador β, pues la correlación entre la variable independiente y las covariables no cambian cuando cambian las categorías, formando líneas paralelas si se graficaran las estimaciones para cada categoría.
Se contrasta la hipótesis nula en la que todas las líneas son paralelas:
Mediante un contraste de razón de verosimilitud entre el modelo con coeficientes comunes y el que tiene diferentes coeficientes o la prueba de Wald se contrastan las hipótesis. Si se rechaza la hipótesis nula implicaría que las variables independientes tienen efectos diferentes para cada categoría de la variable dependiente (O’Conell, A., 2006).
1 Para mayor información, ver los estudios hechos por DeLeire y Kalil (2010) en EE.UU. y los de Powdthavee (2010) en el Reino Unido.
2 Winkelmann (2012) recopiló los registros administrativos de automóviles Ferrari y Porsche de la localidad como una variable aproximada del consumo de los vecinos.
3 Aunque se elaboraron diversos modelos multinomiales con la variable original, es decir, en su versión sin agrupación, no se encontró evidencia estadísticamente significativa con el gasto, o bien, había una pérdida en la calidad en el modelo, vista mediante los indicadores de predicciones correctas, por lo que se decidió agrupar a la variable original, logrando así encontrar significancia estadística con el gasto.
4 Aunque se realizaron ambos modelos eliminando esta variable, los resultados del resto de las variables con suficiencia estadística no se vieron modificados, pero sí la calidad del modelo en términos del porcentaje de predicciones correctas del modelo. Por esta razón, se conservó dentro de ambos modelos.