Un centro nacional que potencia la resolución de problemas con ciencia de datos
A fines de 2022 comenzó a funcionar el Centro Interinstitucional en Ciencia de Datos (CID), por iniciativa conjunta de la UBA y del Ministerio de Ciencia, Tecnología e Innovación. El centro está instalado en el edificio Cero más Infinito de Ciudad Universitaria y resulta una propuesta innovadora que promueve la formación y vinculación interdisciplinaria en Ciencia de Datos, cuyo propósito es construir un ecosistema de organizaciones que gestionen mejor, utilizando la evidencia disponible.
Para conocer más sobre los proyectos actuales del CID, conversamos con Marisa Galvagni, Coordinadora de Investigación, Desarrollo y Formación Académica de este Centro.
¿Con qué propósito se crea el CID y cuáles son sus ejes de trabajo?
La clave es acelerar la adopción de tecnologías en ciencia de datos por parte de organizaciones públicas y privadas. Ese es el principal propósito. Esto significa que “adoptantes”, que pueden ser preferentemente de organismos públicos pero también privados, tengan problemas concretos a resolver donde la ciencia de datos pueda proponer una respuesta y demanden una salida superadora a esa necesidad. “Adoptantes” es una palabra clave en nuestro ecosistema de proyectos, ya que no son clientes ni necesariamente organismos públicos.
¿Cómo lo hacemos? Nos organizamos en virtud de esta misión con proyectos concretos como punta de lanza que se inician a partir de estas necesidades de parte de los adoptantes. Surgen de la necesidad y compromiso de estos actores, fundamentalmente donde la ciencia de datos es el motor y la mejor respuesta. Y en base a esos proyectos se buscan personas con perfiles que puedan, sepan y quieran asociarse a ese proyecto.
A su vez tenemos un segundo eje de trabajo, un espacio que se llama Ciclo de Ateneos donde abordamos distintos tópicos muy diversos, pero donde todos ellos están justamente atravesados y pueden tener una evolución positiva de la mano de la ciencia de datos y de todas las tecnologías alrededor de esta nueva de esta nueva materia prima con la que contamos.
Este Ciclo de Ateneos propone tópicos de distinta índole, muy diversos entre sí. Ya hicimos tres, el primero fue sobre innovación en salud donde estuvieron presentes exponentes de inteligencia artificial aplicada al diagnóstico por imágenes y cirugías asistidas por computadora y donde fue muy interesante por los adoptantes que convocamos que fueron instituciones públicas y privadas de primera línea, que ya tienen un recorrido iniciado en estas cuestiones.
El segundo ateneo se realizó alrededor del tópico de seguridad y protección de datos, contemplando no solamente la cuestión de la identidad y privacidad de los datos sino también toda la cuestión de ciberseguridad: cómo las infraestructuras críticas de los estados necesitan medir vulnerabilidades y tomar acciones correctivas para evitar cualquier tipo de ataque. En esta oportunidad estuvo licenciado Diego Adrián Castro, Gerente de Datos de Nación Servicios, y también todo el equipo de la Dirección Nacional de Migraciones, contándonos desde los desafíos que tienen en su infraestructura hasta cómo fueron resolviendo todas las partes de Data Analytics.
Y en el tercer ateneo estuvo el destacado ingeniero argentino Miguel San Martín de la NASA, que abordó el tópico aeroespacial de los desafíos de descensos en Marte: cómo esta comunión entre computación y matemática, en los descensos en Marte, conjugan la máxima expresión de toda las disciplinas exactas posibles, no solo computación, matemática y ciencia de datos, sino también geología, meteorología e ingeniería, por supuesto.
Nosotros vamos abordando temas de vanguardia donde la ciencia de datos tiene algo para decir y por ahora los estamos debatiendo. La idea, es que a medida que vayamos concluyendo proyectos, esos mismos proyectos sean justamente insumos para analizar con un formato de estudio de caso, en estos ateneos (de hecho el proyecto que está más próximo a ser culminado, es un proyecto que esperamos se pueda presentar en el último ateneo del año, que será en noviembre)
Y el tercer espacio de trabajo del CID se llama Plaza de Datos y propone en especial para estudiantes un lugar de experimentación, un lugar donde no hay una lógica de proyecto con principio y final, un acercamiento lúdico al mundo de los datos, con modelos para explorar, y que resulte un lugar de intercambio y acceso libre.
La Plaza de Datos se va a inaugurar el 18 de octubre y es un lugar muy interdisciplinario porque lo estamos trabajando junto a un doctor en física, un estudiante de matemática y ciencia de datos y un estudiante de computación y de filosofía. Hay una diversidad de miradas muy interesante para que sea más convocante.
La premisa es hacerlo con gente del universo Exactas que tiene ganas de salir de Exactas, para resolver problemas concretos de la vida real, con organizaciones de escala y que puedan generar un cambio significativo asociado a la ciencia de datos.
O sea que el propósito es que también funcione como un espacio formativo.
Sí, la idea es que alimente este ecosistema: los proyectos a la cabeza, los ateneos, cuya intención es que aporten adoptantes con temas donde los datos pueden mejorar esa necesidad y que la Plaza de Datos sea un punto de encuentro para convocar a estudiantes que les interese trabajar en esos proyectos. Que no necesariamente estén todavía en un marco laboral.
La Plaza de Datos es una especie de semillero, de lugar de experimentación, porque muchas de estas cuestiones tienen que ver con temas nuevos que se actualizan permanentemente y con inquietudes concretas. No necesariamente los proyectos tienen una respuesta inequívoca y la verdad que la Plaza de Datos además de ser un lugar de experimentación, también será un lugar de reflexión sobre posibles caminos alternativos, sin tener la presión hacia un resultado o un deadline de manera obligada.
¿En qué proyectos están trabajando desde el CID?
Tenemos proyectos muy concretos que dan cuenta de iniciativas con datos y con modelos incluso asociados a inteligencia artificial, pero el tema es llegar a organismos o dependencias que tengan políticas activas, preparadas para enmarcarlas en el asunto; a partir de esa lectura que los datos nos pueden dar.
Un ejemplo muy interesante que materializa esta idea es un sistema de alerta temprana de abandono escolar que estamos desarrollando, cuyo foco es predecir qué chicos o chicas tienen más probabilidad de dejar la escuela. También hay un proyecto muy interesante para detectar y medir la exposición ciertas ocupaciones del mercado de trabajo a la inteligencia artificial generativa y ese proyecto, en especial más analítico, fue pedido por el Ministerio de Trabajo de la Nación.
Otro proyecto está destinado a la Secretaría de Agricultura, Ganadería y Pesca de la Nación; en virtud de una normativa internacional relativamente nueva que tiene que ver con analizar el origen de cultivos que puedan provenir de zonas deforestadas. No sólo existe un objetivo ambiental sino también económico, de sostenibilidad de exportaciones para la Argentina.
Después en el ámbito privado tenemos a un adoptante que es FLENI, que tiene un proyecto para Latinoamérica donde hay doce países involucrados y en este caso se desarrollan sistemas de alerta, donde hay tableros para medir la evolución y la prevención de la demencia o, dicho de otra manera, el deterioro cognitivo leve. Cómo distintas técnicas no sólo permiten detectarlo tempranamente sino actuar tempranamente para reducir la probabilidad de esta patología en mayores de 65 años.
¿Qué perfil tienen las personas que trabajan en los proyectos, hay tanto estudiantes como investigadores?
La idea es no sólo buscar expertos en la materia sino que haya diversidad, ya que en este tipo de proyectos se combinan analistas de datos, estudiantes especialistas en datos, con personas que ya tienen un trayecto de formación, sea en doctorado o posdoctorado. Muchas veces son investigadores de CONICET que ya tienen una línea de trabajo marcada y afín a la problemática de cada uno de los adoptantes en particular. Pero buscamos que sean grupos diversos; actualmente son grupos pequeños porque hasta ahora la idea es que los proyectos tengan mínimo dos y máximo cinco personas asociadas.
¿Ustedes en general hacen una búsqueda abierta de candidatos y candidatas para los proyectos?
Sí, de hecho sería interesante conectarse, por ejemplo, con especialistas de la Maestría en Ciencia de Datos, ya que es gente que no necesariamente hizo su carrera de grado en Exactas. Puede haber gente de otras universidades y de otras disciplinas, con una rica formación para estos proyectos.
Por último, ¿cómo se piensa el CID a futuro, cuál sería su visión a largo plazo?
La primera proyección a futuro es autofinanciarnos. Este es un centro codependiente de la UBA y del Ministerio de Ciencia, y el objetivo, por un lado, es lograr un caudal de proyectos incluso convocando a empresas privadas, para que justamente el Centro se pueda financiar por sus propios medios.
Pero por otro lado también la intención es revertir la idea de que tenemos un Estado que no aprovecha los datos para su toma de decisiones o para gestionar de una manera más eficiente o por lo menos mitigar esa percepción, para que justamente el Estado se apropie de la ciencia de datos en pos de un bienestar para la ciudadanía.
Es importante recalcar que no dejamos de ser “una organización de lucro”, un organismo público, y la idea es que nuestro trabajo sostenido en el tiempo impacte positivamente en mejoras concretas para la población.
Marisa Galvagni
Es licenciada en Administración (UBA) y Magíster en Evaluación de Proyectos (ITBA). Cuenta con amplia experiencia en áreas gerenciales del sector privado internacional y de consultoría del sector público. Se especializa en formación de equipos, procesos de desarrollo colectivo y modelos de trabajo en comunidades. Es la actual Coordinadora de Investigación, Desarrollo y Formación Académica del CID.