Análisis de los Estudios de Género a través del procesamiento del lenguaje natural

Por Juan Pablo Sokil (Licenciado en Sociología-UBA, Magister en Explotación de Datos y Descubrimiento del Conocimiento-UBA)

El origen de los estudios de género puede situarse en la década del 70 del siglo XX, cuando un grupo de intelectuales comenzó a cuestionar el rol que ocupaba la mujer dentro de la sociedad. Ellas plantearon que la estructura social no solo se componía por un sistema de clases sociales, sino también de sexos, y esto establecía jerarquías que beneficiaban a los hombres por sobre las mujeres.

Con el paso de las décadas, los estudios de género fueron moldeando su objeto de estudio, en la actualidad pueden definirse como toda investigación que posea al género como categoría central (estudios sobre feminismo, estudios de la mujer, estudios del hombre y los estudios de diversidad sexual); su complejidad hace que abarque incontables áreas de estudio, entre ellas: trabajo; salud; violencia; educación; derechos.

Las investigaciones sobre género, del mismo modo que las de cualquier área temática, se socializan en forma de publicación científica: publicar es presentar al mundo la investigación. Por eso, para analizar la actividad científica, resulta indispensable recurrir a las publicaciones como fuente de datos, siendo las bases de datos bibliográficas el mejor insumo.

¿Cuáles son los objetivos de la tesis?

Analizar la producción científica sobre Estudios de Género en Ciencias Sociales en el periodo 2004-2018 mediante la base bibliométrica Scopus, buscando conocer su distribución espacio temporal, su magnitud y temáticas.

Analizar si la magnitud y temáticas de investigación dentro de los Estudios de Género se correlacionan con Índices de Disparidad de Género (Global Gender Gap).

Metodología

Se trabajó con los títulos y resúmenes de las publicaciones científicas. Se identificaron los países de los autores y las autoras a través de la firma institucional. Se utilizaron técnicas de modelado de tópicos (Latent Dirichlet Allocation), previamente se procesaron los textos con etiquetado gramatical (Part of Speech Tagging), se lematizaron las palabras y se calculó la información mutua para identificar conceptos relevantes (Collocations).

Todos los resultados fueron validados mediante pruebas estadísticas no paramétricas, además se calcularon ajustes en todas las comparaciones entre grupos para brindar mayor robustez en los análisis.

Resultados

Los Estudios de Género se incrementaron un 393% a lo largo de los quince años de estudio, su crecimiento no fue solo de magnitud, sino que el interés en la temática (definido como Especialización en Estudios de Género) también ha crecido, aumentando más de un 50% a lo largo de estos quince años.

Con respecto a su distribución espacial, como se observa en el gráfico 2, no es uniforme, sino que existen países y regiones donde el esfuerzo dedicado a la investigación es mucho mayor/menor que en otros, fluctuando entre el 3,7% de Islandia y el 0,1% de Irak.

Como hemos dicho, los estudios de género abarcan una diversidad de temas, para identificarlos se aplicaron técnicas de procesamiento de lenguaje natural sobre los títulos y resúmenes de las publicaciones, y posteriormente se trabajó con un algoritmo de modelados de tópicos (Latent Dirichlet Allocation – LDA).

Se encontraron 30 tópicos relevantes. Se calculó su participación, observándose que no todos los temas tienen la misma presencia en los textos, sino que hay algunos mucho más frecuentes que otros.

También se calculó su evolución temporal, pudiendo observarse un fuerte dinamismo, con tópicos que disminuyeron a lo largo del tiempo y otros que incrementaron su participación.  Dentro del primer grupo, se destacaron aquellos asociados a la salud física y/o mental, este descenso puede vincularse a un viraje analítico dentro de los Estudios de Género, un paso de temas asociados a la salud hacia el estudio de aspectos culturales y teóricos, en este sentido, se puede ver que entre los tópicos que más se incrementaron se encuentran aquellos asociados a aspectos teóricos, dedicados a interpretar problemáticas relativas a la cuestión de género.

Finalmente, se analizó la Especialización Temática de los países, replicando los análisis previos, fue posible descubrir que no solo hay países que dedican mayor esfuerzo que otros a estudiar sobre género, sino que ese esfuerzo se hace en distintas áreas temáticas.

Se pueden destacar, la relevancia del T73 (Estereotipos de Género) en los países que formaban parte de la Ex-Yugoslavia, o la del T62 (Violencia Domestica) dentro de África Oriental y también la fuerte presencia del T96 (Teoría Feminista) y T21 (Identidad de Género) en Europa del Norte, este dato entra en dialogo con la teoría de “ciencia euro centrista”, que propone que los desarrollos teóricos se concentran en los países desarrollados, mientras que el resto los utiliza.

Todos estos fenómenos son posibles líneas de investigación futura, pero requieren conceptualizaciones más precisas, detalladas y análisis que permitan aprehenderlos con mayor profundidad.

Para estudiar la disparidad de género, se utilizó el Global Gender Gap (https://es.weforum.org/reports/the-global-gender-gap-report-2018), este índice evalúa los países según la división de sus recursos y oportunidades entre la población masculina y femenina; brinda un valor que fluctúa entre cero y uno (mientras más cercano a la unidad supone mayor paridad de género).

Si bien el índice presenta un valor global, en realidad es el promedio de cuatro subíndices (cada uno abocado a un área específica): Participación Económica y Oportunidades, Logros Educativos, Salud y supervivencia y Empoderamiento Político.

Al analizar los datos se observó que los cuatro subíndices brindaban mayor variabilidad, por ende, daban mayores oportunidades para el análisis. Siguiendo esta línea fue posible descubrir que las asociaciones entre la Especialización en Estudios de Género y la disparidad de género ocurren en distintas áreas, con distinta intensidad y distinto signo.

 

Buscando profundizar estos resultados, se replicó el análisis utilizando los tópicos identificados mediante LDA (en lugar de la Especialización en Estudios de Género). En este punto se logró asociar un solo tópico T92 (Género y Trabajo) al subíndice de Global Gender Gap: Participación Económica y Oportunidades.

Esto puso en evidencia una fuerte incompatibilidad entre lo que se investiga en Estudios de Género y lo que se utiliza como indicadores para medir la disparidad. Por ejemplo: con los indicadores utilizados en Global Gender Gap solo hay espacio para analizar una concepción binaria de género (Mujer-Hombre), mientras que uno de los tópicos de mayor participación (y mayor crecimiento) fue el T21 (Identidades de Género) que precisamente cuestiona esa concepción.

Algo que llamó la atención al analizar las asociaciones entre las distintas variables y segmentos, fueron las diferencias del signo (a veces positivo, a veces negativo). Esto llevó a plantear la hipótesis de que el signo de la asociación se vincula al Estadio de Paridad de Género en que se encuentran los países; por lo tanto, cuando un país tiene un Global Gender Gap bajo tiene alta inequidad, entonces, va a investigar más sobre el tema, incrementando la especialización en ese tópico crecerá a lo largo del tiempo, y dando una pendiente positiva si calculamos una regresión.

En el grafico 4, se ve que no es posible encontrar ese patrón lineal, si bien vemos una cierta pendiente negativa que apunta a esta idea. A nivel continental observamos diferentes situaciones, mientras que en Europa y América parece cumplirse, en África la pendiente es opuesta.

Conclusiones

El trabajo realizado a lo largo de estas páginas ha permitido desentramar parte de la complejidad de los Estudios de Género y entender algunas de sus características.

Si bien, querer construir un proyecto tan abarcativo resultó complejo, fue posible identificar características espacio-temporales distintivas.

En referencia a los aportes brindados por esta tesis, se puede destacar la construcción de un mapa temático sobre los Estudios de Género a nivel país / región / continente, a diferencia de experiencias previas basadas en revistas específicas o de índole más general, aquí puede conocerse la Especialización en Estudios de Género y sus temáticas para países de los cinco continentes para un periodo de 15 años.  Estos indicadores brindan un marco de referencia y quedan disponibles como insumo para futuras investigaciones. mediante un reporte publicado en la siguiente dirección: https://juanpablosokil.shinyapps.io/Reporte_Tesis/.

Además, al disponer de toda la metodología de trabajo bien documentada y del modelo entrenado en un repositorio (https://github.com/juansokil/Tesis-Maestria-DM) es posible continuar el análisis para años posteriores (o incluso replicarlo para otras bases de datos).

Bibliografía

Albornoz, M., Barrere, R., Matas, L., Osorio, L., y Sokil, J. (2018). Las brechas de género en la producción científica iberoamericana. En El Estado de la Ciencia. Principales indicadores de ciencia y tecnoloǵıa Iberoamericanos / Interamericanos, p 31–46.

Blei, D. M., Ng, A. Y., y Jordan, M. I. (2003). Latent dirichlet allocation. J. Mach. Learn. Res., 3:993–1022

Bonder, G. (1984). Los Estudios de la Mujer y la Crítica Epistemológica a los Paradigmas de las Ciencias Humanas. Revista Desarollo y Sociedad, 13.

Hall, D., Jurafsky, D., y Manning, C. D. (2008). Studying the history of ideas using topic models. In Proceedings of the Conference on Empirical Methods in Natural Language Processing, EMNLP ’08, pages 363–371, Stroudsburg, PA, USA. Association for Computational Linguistics.

Thelwall, M., Bailey, C., Tobin, C., y Bradshaw, N. (2018). Gender differences in research areas and topics: An analysis of publications in 285 fields. CoRR, abs/1809.01255.

World-Economic-Forum (2019). The global gender gap report 2018.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *