Informalidad laboral en México: Un análisis desde la Estadística y la Econometría Espacial
En las entidades del norte y el Bajío se concentran valores altos del PIB per cápita y de la tasa de crecimiento económico, al mismo tiempo que se observan valores relativamente bajos de informalidad laboral y de pobreza extrema. En el sur y sureste del país la situación es exactamente la contraria
Cumpliendo con el compromiso contraído, utilizando las herramientas de la Estadística y la Econometría Espacial, hoy analizo la informalidad laboral en las entidades federativas del país, considerando la influencia que sobre ella ejercen, el PIB per cápita, la pobreza extrema y la tasa media de crecimiento del PIB de las entidades federativas. En el caso de la informalidad, la información corresponde a la tasa (porcentaje) de la población que se encontraba ocupada laborando en el mercado informal en el 2020, mientras que el PIB per cápita, que también corresponde al 2020, está medido en millones de pesos por entidad federativa, la pobreza extrema en el año 2020 expresa el porcentaje de la población estatal en esa condición y por último la tasa media de crecimiento del PIB corresponde al crecimiento promedio anual de las economías regionales en los últimos cuarenta años (1980-2020).
Para ponernos en contexto, recupero una caracterización del mercado laboral informal que hice en este espacio hace poco más de dos años. Decía entonces, que se denomina empleo informal a todas aquellas actividades laborales realizadas por personas que trabajan y perciben ingresos al margen del control tributario del Estado y de las disposiciones legales en materia laboral. Son parte del empleo informal el que realizan los trabajadores independientes, los vendedores ambulantes, las trabajadoras de servicio doméstico, los limpiavidrios, entre otros. Se trata de empleos que en general son mal remunerados y ofrecen condiciones laborales inciertas y de gran vulnerabilidad, en tanto carecen de protección social y no ofrecen estabilidad económica para los trabajadores. Son características también de este tipo de empleo, los despidos sin compensaciones, la exigencia de trabajar horas extra o turnos extraordinarios y el incumplimiento de los beneficios sociales, como pensiones, las incapacidades por enfermedad o el seguro de salud.
En el referido análisis establezco la relación de la informalidad con una serie de variables económicas y sociales y, de ellas, recupero algunas para la presente discusión, anticipando que en términos de su capacidad explicativa anticipo que se espera que las entidades federativas con un mayor PIB per cápita y con una mayor dinámica de crecimiento en los años recientes presenten menores tasas de informalidad, mientras que las regiones con mayor pobreza extrema estarían mostrando un mayor porcentaje de su población ocupada en el mercado laboral informal.
LEE MÁS: Crece tasa de informalidad y trabajadores con salario mínimo: ENOE
De acuerdo con lo dicho (me refiero a la colaboración de hace 15 días), dedicaré el presente análisis a la parte que antes señalé se identifica como el Análisis Exploratorio de Datos Espaciales (AEDE). Para esta ocasión me concentraré en el AEDE I Básico. Inicio construyendo una serie de mapas usando la técnica de cuantiles. En este caso he utilizado cuartiles, que dividen las regiones en cuatro grupos, dependiendo de los valores contenidos en cada variable. Así tenemos las que contienen valores bajos, medios, altos y muy altos.

Para destacar, que las entidades del sur-sureste del país son las que muestran un mayor porcentaje de su población ocupada en condición de informalidad, pero son además las que muestran un menor PIB per cápita y un mayor porcentaje de su población en condición de pobreza extrema. Son también, aquellas cuyas dinámicas de crecimiento han sido más lentas en las últimas cuatro décadas. Las del norte, en cambio, presentan menor informalidad y pobreza extrema y son, también, las que muestran un mayor PIB per cápita y tasas más dinámicas de crecimiento económico.
Además, puedo adelantar que las variables evidencian la presencia de autocorrelación espacial positiva, dada la concentración de valores altos y bajos de las variables analizadas. Es decir, los valores en algunas unidades geográficas son similares a otros objetos o actividades en unidades geográficas próximas. Prácticamente sucede con todas las variables en el caso de las entidades del sur del país y con más claridad en el caso de la informalidad, en las regiones del norte.

Podemos observar el grado de concentración y de dispersión espacial de las variables a través de la construcción y análisis del llamado mapa de Desviación Estándar. Este mapa muestra la desviación de los datos con respecto del comportamiento promedio de la variable, considerando variaciones unitarias de la desviación estándar en hasta tres unidades por encima y por debajo de la media. Destacan los niveles bajos de informalidad (2 desviaciones por debajo de la media) en Baja California, Baja California Sur, Coahuila, Nuevo León y Aguascalientes, en contraste con los valores altos en el sur del país (2 desviaciones por encima de la media). También, los niveles altos y muy altos del PIB per cápita en la CDMX y Campeche. Además, los niveles altos y muy altos (3 desviaciones por encima de la media) de condiciones de extrema pobreza en Oaxaca, Guerrero y Chiapas. Para el mapa de desviación estándar para el crecimiento económico, se tienen las mayores desviaciones (2) con respecto a la media, en las entidades de Baja California Sur, Nuevo León, Aguascalientes, Querétaro y Quintana Roo.
LEE MÁS: El empleo mejora en junio, pero 55.4% de la población sigue en la informalidad: Inegi
A través del AEDE puede identificarse también la presencia de datos atípicos. Es decir, situaciones de discontinuidad en el comportamiento de una variable. Llaman la atención porque son valores excepcionalmente bajos/altos que pueden no ser representativos de la distribución general y afectar el comportamiento de los contrastes estadísticos. Estarían retratando un segmento interesante de la población, que puede corresponder a zonas calientes o frías asociadas al desempeño de una variable. Para identificar los valores atípicos suelen utilizarse los llamados mapas de percentiles, que dividen los valores de la variable en 100 partes y cuyo propósito es acentuar los valores extremos, específicamente identificando los valores que se ubican por debajo del percentil 10 y por encima del percentil 990. En este caso, para las variables objeto de análisis, no aparecen valores extremos, pero muestro el mapa de percentiles correspondiente a la población ocupada informal, en donde puede observarse la ausencia de valores en los extremos, pero tres entidades en los percentiles del 90 al 99, que corresponden a los estados con mayor informalidad.
Los datos atípicos pueden identificarse también mediante el diagrama o mapa de caja. Se trata de un rectángulo que se construye de tal forma que el valor inferior de la misma es el primer cuartil (que contiene el 25% de las observaciones) y el valor superior, el tercer cuartil (que contiene el 75% de las observaciones). En mitad de la caja se representa la medianacon un círculo y una línea horizontal que pasa sobre ella. Las llamadas cotas se obtienen sumando/restando a la mediana el producto de los valores del tercer (primer) cuartil por 1.5 veces (ó 3 veces) el recorrido intercuartílico. Precisamente, se consideran valores atípicos a aquellos que se sitúan por encima (o por debajo) de dichas cotas. De acuerdo con el diagrama de caja, la variable ocupación en el sector informal no presenta valores extremos o atípicos, pero si el PIB per cápita (Campeche y la CDMX con valores extremos grandes), la pobreza extrema (Chiapas y Guerrero con valores extremos grandes) y la tasa de crecimiento del PIB (Campeche con valor extremo pequeño).

Los mapas de dispersión bivariante y los mapas de dispersión espacio-temporal son muy útiles para reflejar la relación entre dos variables específicas. Puedo construir un mapa de dispersión para la población empleada en el mercado informal y cualquiera de las variables que estoy considerando en este análisis. Por ejemplo, si la relación se establece con el PIB per cápita de las entidades federativas, se tendría un mapa de dispersión en el que pueden distinguirse, por cuadrantes, las entidades federativas que tienen un PIB per cápita alto y altas tasas de informalidad (Cuadrante I), un PIB per cápita bajo y altas tasas de informalidad (Cuadrante II), un PIB per cápita bajo y bajas tasas de informalidad (Cuadrante III) y un PIB per cápita alto y bajas tasas de informalidad (Cuadrante IV). En el Cuadrante II estarían las entidades federativas en peor condición.
El mapa de dispersión muestra una pendiente negativa en la línea de regresión correspondiente a estas variables (acumulación de valores en el II y IV Cuadrante), lo cual evidencia la existencia de una relación negativa o inversa entre ellas. Es decir, las entidades con los mayores valores de PIB per cápita suelen ser las que presentan tasas de informalidad más bajas, o bien, a las regiones con los menores valores de PIB per cápita corresponden las tasas de informalidad más altas. Las entidades destacadas en el mapa pertenecen al llamado mapa de dispersión espacio-temporal y en este caso corresponden a las entidades ubicadas en Cuadrante II.

En el caso de la asociación entre la informalidad y los niveles de pobreza extrema, se observa una relación directa o positiva, es decir, las entidades con mayor pobreza extrema son las que muestran las mayores tasas de informalidad. Ahora los valores se acumulan en los Cuadrantes I y III y las entidades en la peor condición son las ubicadas en el Cuadrante I (mapa espacio-temporal).

Una alternativa al diagrama de dispersión, ya que permite un análisis multivariante (superior a dos variables) es el llamado gráfico de Coordenadas Paralelas. En este caso, los valores de las variables se representan en ejes horizontales paralelos, desde los inferiores (a la izquierda del eje) a los superiores (a la derecha). Las observaciones se representan en forma de múltiples segmentos que unen su posición en cada eje de acuerdo con los valores de las variables que correspondan. El gráfico asegura que el valor mínimo se encuentre en el extremo izquierdo y el máximo en el extremo derecho. La principal utilidad de este gráfico es que permite la identificación de agrupamientos de valores en ciertas observaciones que pueden ser también de naturaleza espacial. Considerando de manera simultanea la información que he utilizado para las cuatro variables en el presente análisis, tendríamos el siguiente gráfico de Coordenadas Paralelas.

En él, la línea superior corresponde a la tasa de informalidad, la siguiente al PIB per cápita, la penúltima a la población en condición de pobreza extrema y la última a la tasa de crecimiento de las entidades federativas. El resto de las líneas del entramado, corresponden al comportamiento de las variables en cada una de las entidades federativas. Para ilustrar su interpretación es posible señalar algunas de las líneas en particular y observar la posición que toma en cada una de las variables. Si selecciono, por ejemplo, a Oaxaca, el estado con la mayor tasa de informalidad, observamos que al mismo tiempo se caracteriza por tener uno de los PIB per cápita más bajos, uno de los niveles de pobreza extrema más altos y una de las tasas de crecimiento económico más bajas en los últimos cuarenta años. En cambio, Nuevo León, el estado con la más baja tasa de informalidad, es una región con un PIB per cápita alto, con un uno de los más bajos porcentajes de población en condición de pobreza extrema y con una de las mejores dinámicas regionales de crecimiento de la economía, del ochenta a la fecha.

Para el análisis espacial de los datos pueden utilizarse también los llamados Gráficos Condicionales. Estos gráficos utilizan 2 variables condicionales para dividir los datos en diferentes grupos o categorías. El propósito es representar, para una tercera variable continua, un gráfico (o mapa) con aquellas observaciones que estén comprendidas dentro de cada categoría. Se utilizan para cada una de las variables condicionales 3 categorías, por lo que se producen 9 gráficos o mapas condicionales.

En este gráfico he tomado como variables condicionales la pobreza extrema y el PIB per cápita y, la tercera variable de interés es la tasa de informalidad, misma que se utilizó para la construcción de los mapas. La lectura de la información que estos gráficos generan requiere especificar las condiciones y posteriormente observar las características del mapa correspondiente. Por ejemplo, el mapa ubicado en la esquina inferior derecha corresponde a las entidades federativas cuya condición es que tienen un porcentaje alto de su población en condición de pobreza extrema y al mismo tiempo poseen un PIB per cápita bajo. En este mapa solo aparecen cinco entidades federativas, Guerrero, Oaxaca, Chiapas, Puebla y Tlaxcala. Todas tienen una tasa alta de informalidad laboral. En el otro extremo, en la esquina superior izquierda, aparecen las entidades con la condición de tener un porcentaje bajo de su población en condición de pobreza extrema y un alto PIB per cápita. En este mapa aparecen seis entidades, Baja California, Baja California Sur, Sonora, Coahuila, Nuevo León y Querétaro. Todas tienen una tasa de informalidad baja.
Dejo hasta aquí el análisis que corresponde al AEDE I Básico. En general este ha revelado preliminarmente la relación que existe entre la informalidad laboral y algunas de las variables que podrían estar explicando su evolución o mayor presencia en algunas regiones del país. A través del AEDE se ha detectado la posible presencia de autocorrelación espacial positiva tanto en la variable informalidad laboral como en el conjunto de variables que podrían estar explicando su comportamiento. Esto anticipa la necesidad de realizar posteriormente pruebas estadísticas y econométricas para confirmar su presencia y la eventual incorporación de componentes espaciales a la construcción y estimación de modelos econométricos utilizando las variables en cuestión.
El AEDE I Básico muestra que además de la concentración de valores similares de las variables en estudio, estos se presentan de manera diferenciada en las distintas regiones del país. Así, en las entidades del norte y el Bajío se concentran valores altos del PIB per cápita y de la tasa de crecimiento económico, al mismo tiempo que se observan valores relativamente bajos de informalidad laboral y de pobreza extrema. En el sur y sureste del país la situación es exactamente la contraria. Concentración de pobreza extrema y bajos niveles de ingreso, junto a mucha informalidad y escasa dinámica económica. Esa es la constante en la mayor parte de las entidades de esas regiones. Falta todavía por analizar sobre el comportamiento de estas variables, pero eso será cuando desarrolle las siguientes fases, etapas o componentes para la incorporación del tratamiento de datos espaciales a los modelos econométricos. Por lo pronto, la Estadística Espacial ya nos ha dado buenas pistas.

Las opiniones expresadas aquí son responsabilidad del autor y no necesariamente reflejan la línea editorial de ESPEJO.
Comentarios