Las Dimensiones Latentes del Comercio Internacional

Por Diego Kozlowski (Master en Explotación de Datos y Descubrimiento del Conocimiento – UBA y PhD candidate en DRIVEN-DTU, Faculty of Science, Technology and Medicine, University of Luxembourg).

¿Cómo podemos codificar los patrones de especialización comercial de los países? En un reciente artículo publicado en PLOS ONE (Kozlowski, Semeshenko & Molinari, 2021), procuramos dar una respuesta a este interrogante utilizando modelos provenientes del Procesamiento de Lenguaje Natural. Este proyecto se basa a su vez en mi tesis de maestría para http://datamining.dc.uba.ar/. En notas anteriores (acá y acá) escribimos junto a Leonardo Córdoba sobre el uso de grafos para entender el comercio internacional.  En esta nota, les cuento un poco de qué se trata el recientemente publicado artículo. 

El análisis del comercio internacional es una de las áreas de estudio más importantes de la investigación económica. Desde los comienzos de la economía política clásica constituye un tema de preocupación por el efecto del mismo en el desarrollo económico de los países (Ricardo, 2007). Por su parte, el registro de la información referente al comercio entre países también se remonta en el tiempo.

La cantidad de vínculos comerciales que se establecen entre entidades ubicadas en distintos países implica la imposibilidad de estudiar el fenómeno de forma directa, y plantea la necesidad de elaborar medidas de resumen que permitan apropiar la información subyacente al conjunto de los contratos comerciales existentes.

El comercio internacional es un complejo sistema de flujos, en el que participan múltiples países y una inmensa variedad de productos. Descubrir los patrones subyacentes a este sistema implica un desafío, y de esto se trata nuestro artículo. Allí, aplicamos “Latent Dirichlet Allocation Models”(LDA) (Blei, Ng & Jordan, 2003), un modelo de Topic Modelling en procesamiento de texto. Este modelo se utiliza en procesamiento de texto para descubrir los tópicos de los que habla un documento. Si, por ejemplo, tenemos un corpus con muchos artículos científicos, este modelo es capaz de definir los distintos temas de investigación en el corpus, pero también asigna a cada artículo, una probabilidad de que el mismo trate cada uno de los distintos temas.

En nuestro artículo, proponemos un uso muy distinto al que fue originalmente pensado por los autores de LDA. Nuestra analogía se basa en pensar las exportaciones de cada país (cada año) como un “documento”, y cada producto exportado como una “palabra”. De esta forma, logramos identificar patrones latentes del comercio internacional, y su distribución en los países a lo largo del tiempo.

Aplicamos esta técnica a un dataset de exportaciones de bienes entre 1962 y 2016. Los resultados muestran que este modelo puede capturar los principales patrones de especialización del comercio internacional, y permite también un análisis relativamente detallado a nivel país. 

Agrupamos las dimensiones latentes por tipo (industrial, agro, etc), complejidad, productos y países característicos. Esta clasificación se basa en datos y se centra en los países, a diferencia de los clasificadores tradicionales de comercio internacional (NACE, HS). En la Tabla 1 mostramos los componentes resultantes.

Tabla 1. Componentes Latentes. Grupos, complejidad industrial y país representativo. k = 30.

Para el análisis de resultados, complementamos el artículo con un dashboard interactivo en https://ldaglobaltrade.uni.lu/dashboard/. Utilizamos este dashboard para explorar los componentes arriba mencionados y poder asignarles una etiqueta. Luego, pasamos al análisis de los países. En esta herramienta, indicando países, se puede ver la evolución de la especialización productiva.

Uno de los ejemplos más interesantes es el sendero de la industrialización China: de exportar arroz y algodón a calzado y juguetes, a procesadores y microcircuitos. Un sendero similar ocurre con varios países asiáticos (ver Figura 1). En los casos de Argentina, Brasil y Uruguay, podemos ver que el componente 25 (soja) toma cada vez más importancia. Por su parte, los países petroleros, como Irak, Arabia Saudita y Venezuela muestran un cambio entre dos componentes: del 20 (gasoil) al 12 (petróleo crudo), luego de la famosa ‘crisis del petróleo’. Sin embargo, esto es tan solo una muestra de los posibles análisis que esta herramienta permite.

Figura 1. Distribución de componentes por país. 3: Vehicles and parts; 4: Footwear, clothing and toys; 5: Non-digital electronics; 6: Vehicles, boats, machinery and parts; 9: Coffee, bananas, other food and primary products; 12: Crude petroleum; 14: Lubricating petroleum oils and preparations; 20: Fuel oil, gas-oil.  23: Processors, microcircuits, toys and shoes; 24: Boats, meat, fish, dairy; 25: Soya and derivatives, Iron; 27: Electronic microcircuits and machinery parts. 28: Rice, cotton, textiles.

Además. a nivel componente, podemos identificar la obsolescencia tecnológica, y cómo los países dejan de exportar productos que van quedando anticuados, como máquinas grabadoras, líneas de teléfono o papel fotográfico. En nuestro modelo, muchos de estos productos quedaron agrupados en el componente 5 (ver Figura 2).

Figura 2. Evolución del componente 5: Non-digital electronics, record tapes, telephone lines, photographic paper.

En resumen, presentamos una nueva aplicación de LDA a un dominio diferente al que fue concebido, a la vez que una nueva técnica para complementar los análisis tradicionales del comercio internacional. ¡Ojalá lo encuentren útil!

Referencias

Blei, D. M., Ng, A. Y., & Jordan, M. I. (2003). Latent dirichlet allocation. The Journal of machine Learning research, 3, 993-1022.

Kozlowski, D., Semeshenko, V., & Molinari, A. (2021). Latent Dirichlet allocation model for world trade analysis. PloS one, 16(2), e0245393.

Ricardo, D. (2007). Principios de economía política y tributación. Claridad, Buenos Aires, 2007.

 

Facebooktwitterlinkedin

Dejá un comentario

Tu dirección de correo electrónico no será publicada. Los campos necesarios están marcados *