Capacidades en Datos

Por Ignacio Uman – Daniel Yankelevich es informático, licenciado en la ESLAI en Argentina y recibió su PhD en la Universidad de Pisa. Realizó un postdoctorado en Carolina del Norte, EE.UU. Ha realizado tareas docentes y de investigación en varias universidades en Argentina y como profesor invitado en otras universidades de la región. En el ámbito privado, es socio fundador de Practia, un grupo de empresas dedicadas a la consultoría e informática en Latinoamérica, se desempeñó además como CEO del grupo. Dirigió varios proyectos comerciales y de investigación tanto desde la academia como desde el ámbito privado, en particular en la temática de ciencia de datos e impacto de los cambios tecnológicos en los negocios. Actualmente está a cargo del programa de Datos y Negocios en la UTDT.

Recientemente fue designado Director del área de Datos de Fundar, una organización dedicada al estudio, la investigación y el diseño de políticas públicas con foco en el desarrollo de una Argentina sustentable e inclusiva. Para conocer más sobre este nuevo rol, Predictivos dialogó con Yankelevich, quien comentó sobre los diversos proyectos que desarrollan apoyados en el análisis de datos y resaltó la necesidad de generar capacidades en datos, tanto en la administración pública como en la sociedad en general.

¿Cómo surge tu rol en Fundar y en qué consiste el área de Datos, transversal a las otras áreas?

Fundar es un Think Tank de políticas públicas, orientado al desarrollo, una idea claramente distinta a otras ofertas. Es central el hecho de que hay un área de Datos, en general estos laboratorios de ideas o centros de estudio no tienen un área específica de datos, acá en la Argentina y en la región no es algo habitual pero en otros países sí.

La pregunta sería: ¿por qué un área de datos? Por dos motivos: en cuanto al primer punto estamos convencidos, los fundadores y yo que dirijo el área, que el uso de datos es un recurso fundamental para el desarrollo de los países y hay que saber usarlo (de la misma manera que si uno tiene litio o soja hay que saber usarla, no alcanza solo con tenerla, hay que saber cómo venderla y eventualmente procesarla para sacarle más valor).  Con los datos es lo mismo, si uno tiene datos hace falta poder procesarlos y usarlos para extraer más valor. No es solo una capacidad técnica pero es importante dominar el aspecto técnico. El segundo punto tiene que ver con que creemos que la mejor manera de definir políticas públicas que funcionen, de salir de una discusión puramente ideológica es contar con políticas públicas basadas en datos y tener la discusión en otro nivel de profundidad.

El rol para el que fui convocado es el de Director del área de Datos (cada área tiene un director) y nosotros trabajamos  con tres tipos de proyectos, según con quién nos relacionamos: 1) Proyectos internos, de investigación y generación de documentos o de propuestas. 2) Proyectos con actores externos, en general con la administración pública, no necesariamente con la administración central, a veces con provincias, entes descentralizados, etc. sobre todo para lo que es el desarrollo de capacidades estratégicas y, por último 3) Proyectos comunes con otras áreas de la fundación, donde hacemos trabajos conjuntos que traen un conocimiento muy profundo de un tema y nosotros aportamos la parte de datos, con cuestiones que son sofisticadas desde el tipo de trabajo técnico.

Después tenemos otro eje de clasificación de proyectos basado en cuáles son las temáticas que nos interesan abordar. Hay un eje que tiene que ver con el uso de datos en la administración pública y, por lo tanto, el desarrollo de capacidades. El otro día estuve en el panel de Gobierno de Datos de las JAIIO y arranqué directamente planteando que iba a dar un manifiesto: “si alguien toma una decisión sin usar datos habiendo datos disponibles, eso tendría que ser considerado mala praxis”. Tiene que incorporarse definitivamente el uso de datos e información para tomar decisiones, ¿qué implica esto? no es un reglamento lo que hay que hacer, sino generar el desarrollo de capacidades.

Entonces surge la idea de desarrollar capacidades en el Estado para que tengan más fuerza para encarar esta generación de políticas y toma de decisiones públicas. En particular entra lo de políticas públicas basadas en evidencia y la importancia de entender qué quiere decir evidencia basada en datos. Nosotros publicamos un artículo que salió en los medios sobre la validez de la evidencia en políticas públicas, que plantea esta discusión, hasta dónde nos podemos guiar por los datos, cuál es la relación entre causalidad y toma de decisiones, que aparece fuertemente en el tema de políticas públicas: cómo tomar decisiones usando evidencia.

Lo que más estoy aportando, por mi lado, es un perfil mixto: tengo un perfil académico en el cual sigo dando clases y teniendo trabajos de investigación, y tengo un rol importante en el sector privado. Mi entrada al tercer sector, que la veo como más académica, acerca un poco estas dos posiciones. 

¿En qué consiste la investigación que hicieron sobre Complejidad Económica?

Ese trabajo fue muy interesante, se hizo con el área de Desarrollo Productivo y está en las primeras etapas. Consistió en el análisis de  complejidad económica, utilizando los modelos de complejidad económica, que en su armado implican el análisis de muchísimos datos. Cuanto más datos y más detalle se pueda analizar, mejor va a ser el modelo. Ese modelo no es solo teórico sino que nos dice cómo influye el nivel de complejidad económica de cantidad de productos y la relación entre los diferentes productos en el desarrollo del país y qué cosas se podrían hacer para incrementar ese desarrollo. Para que sea aplicable hay que llegar a un nivel de bastante detalle, se necesitan multiplicar matrices grandes y muchos desafíos técnicos que a nosotros nos gustan.

Trabajamos interdisciplinariamente entre profesionales con formación como data scientists (de nuestro equipo) y economistas con experiencia en políticas públicas (vale aclarar: no es que nosotros somos el departamento de Sistemas, no es que nos pidieron que miremos los datos que ellos tenían, sino que trabajamos codo a codo).

El otro tema en el que estamos trabajando fuertemente es el de ética en el uso de datos, sesgos y algoritmos. Creo que cualquier discusión en cuanto a regulación tiene que partir de la ética, además el uso de datos y algoritmos no es lo mismo. Requieren miradas distintas. De hecho, publicamos un informe sobre anonimización como instrumento de gestión que tiene que ver con la ética en datos. Hay que dar una discusión que tiene un eje técnico muy fuerte sin ser tecnocrática. Nosotros no creemos que la discusión sea puramente técnica pero tiene que incluir ese eje, debe ser una discusión amplia. 

¿Allí se enmarcan las Becas FunDatos?

Así es, dentro de esta temática entran las becas FunDatos, son becas que tienen 3 objetivos: 1) Apuntan a gente que está por recibirse o recién se recibió o está empezando el doctorado, se quiere incorporar a un grupo de investigación pero todavía no lo hizo y está en un cargo docente, gente que va a entrar al doctorado pero no tiene la beca o se está por recibir pero la tesis de licenciatura es muy larga. En general no hay becas para ese segmento de gente, por lo que nos pareció necesario reforzar esa posibilidad. 2) La beca se lleva a cabo junto con grupos de investigación, no es gente individual, es en ese contexto. 3) El tema central es de sesgos en algoritmos, análisis de ética en datos y uso de la información en forma ética.

El perfil de disciplinas que aplica a las becas es amplio, no sólo de Exactas e Ingeniería sino de Ciencias Sociales (sociología, ciencias políticas), Economía o Medicina. Es interesante poder sumar más de la formación cuantitativa en datos a otras disciplinas, enriquecer el campo. Las becas están dando muy buen resultado, los temas son súper interesantes y creo que se pueden lanzar nuevos programas o iniciativas que incluyan también el tema de gobierno de datos, qué quiere decir gobernanza en cuanto a los aspectos prácticos del uso de datos, cómo hacemos para que las diferentes áreas puedan intercambiar datos, necesitamos trabajar sobre anonimización, romper silos o cómo saber quiénes son los dueños de los datos, cuáles son las técnicas que se pueden usar para aplicar en el área.

¿Cómo se organiza y gestiona la vinculación con las administraciones públicas?

El segundo grupo de proyectos, que es con actores externos, se realiza con parte de la administración pública u organismos descentralizados, es un trabajo que tiene una parte más teórica (contar, comentar), típico de Think Tank de acompañar, promover políticas o formas de trabajo. Pero hay una parte práctica de manos a la obra, trabajar con funcionarios y grupos ayudándolos a resolver tareas. Por ejemplo estamos trabajando con el Ministerio de Turismo, que tiene un grupo de datos buenísimo con gente valiosa que tiene muchísimo conocimiento pero que claramente no alcanza a hacer todo lo que se puede y quiere hacer. Trabajamos en temas concretos que tienen que ver con análisis de datos, organización de la información o incluso cómo armar encuestas, un tema que no es menor. Al fin y al cabo hay una parte que es la captura de datos que es un problema enorme en todo lo que es el análisis de poblaciones.

Cabe recalcar que la fundación es muy nueva, empezamos en 2020 en pleno año de pandemia pero en este período corto tuvimos varios proyectos para los que todavía por un tema de tiempo no tenemos la trayectoria y el equipo armado a full. Hicimos unos cuantos proyectos, con la provincia de Buenos Aires y con otras provincias. También con el Ministerio de Salud hicimos algunos análisis de datos en profundidad (conseguimos datos de movilidad con los que hicimos varios análisis). Tenemos un área de Salud que trabaja con administraciones a nivel nacional y también en las provincias, que hizo algunos análisis muy interesantes. Además trabajamos con la otra área transversal que es Géneros, hicimos muchos trabajos de análisis de información con el tema de políticas de género, hay muy poco publicado y la falta de representación de los datos en esa área influye negativamente en la generación de políticas públicas. A medida que tengamos más capacidades y se vaya entendiendo mejor lo que hacemos, vamos a desarrollar más proyectos.

¿Por qué cuesta entender el propósito del área?

La verdad es que no hay muchos laboratorios de ideas con área de datos, por lo que al ser algo tan nuevo no todo el mundo tiene claro qué es lo que hacemos y podemos dar. A veces se nos confunde con Sistemas. Entonces tenemos que salir a aclarar cuál es nuestro metié. Poco a poco iremos encontrando nuestro lugar y ver qué es lo que hace falta, no hay ninguna institución ni actor con el que hayamos hablado que nos haya dicho que no le hace falta nuestro servicio o asesoramiento. Todo el mundo necesita hacer algo con los datos y a todo el mundo le faltan capacidades.

¿Creés que la pandemia visibilizó la importancia del análisis estadístico, del análisis de los datos y acceso a la información pública para tomar decisiones?

Creo que tuvo un impacto, la pandemia aceleró este proceso que ya era visible y marcó un nuevo escenario. Lo hizo más visible a partir de diferentes cuestiones, en primer lugar en el uso de modelos (este ejemplo del modelo “achatar la curva de casos”, que es un modelo no es una realidad) para tomar decisiones y comunicar una política pública fue muy interesante, muy rico. En segundo lugar, este tema mediático, la gente mirando todos los días la cantidad de casos y la cantidad de fallecidos (lamentablemente), claramente público en general mirando muchos datos y tratando de interpretarlos. De golpe empezamos a ver que los casos que se están mirando son solo los que se testearon y si se testea poco entonces falta algo. En tercer lugar, apareció la discusión sobre el uso de la evidencia. Me acuerdo en particular la discusión sobre la presencialidad en escuelas, donde teníamos las dos posiciones enfrentadas y los dos grupos venían a decir “yo tengo la evidencia de esto”. Fue algo muy llamativo, hasta cómico. En el artículo que publicamos, un poco hacemos esta advertencia de qué quiere decir tener la evidencia y cómo se toma la decisión. Esto marcó un nuevo juego en la toma de decisiones.

Considero que hoy las decisiones políticas piden cada vez más tener datos para poder comunicar y justificar. Nadie lo nombra pero aparece la idea de los modelos desarrollados como parte de la toma de decisiones y la planificación de políticas públicas. De hecho, por ejemplo, la discusión sobre la cuarentena intermitente partió de modelos de simulación, fue un aporte muy valioso de investigadores que puede ayudar a mostrarnos cómo vivir mejor.

Y allí también aparece la necesidad de tener una ciudadanía formada en datos y estadística…

Creo que en el fondo la clave es la Cultura de los datos, lo que en inglés llaman Data Literacy (alfabetización en datos). En algunas instituciones o formaciones no está presente, no digo que esto pase en todas las administraciones o en toda la población, el tema es que necesitamos generar una cultura o una alfabetización en datos mucho mayor que la que existe hoy. ¿Cómo lograrlo? En esta formación de datos deberíamos incluir ciertos contenidos un poco más soft, que la respuesta a muchas de las preguntas donde se usan datos para responder, aunque no se cuente con la evidencia pueda ayudar la información disponible, tiene que ver con cómo uso los recursos de los que dispongo para el análisis. No debe ser una formación excesivamente tecnicista, se debe aprender a interpretar datos, sumar al análisis social la formación cuantitativa sólida y aprender a relacionar diferentes variables de análisis.

Facebooktwitterlinkedin

Dejá un comentario

Tu dirección de correo electrónico no será publicada. Los campos necesarios están marcados *