Ciclo de Charlas
Conversaciones sobre Ciencia de Datos
recorridos ida y vuelta desde big data al conocimiento aplicado
12° encuentro del Ciclo
"De la inteligencia artificial a la ciencia de datos: desafíos y problemas del procesamiento del lenguaje natural"
02 de octubre de 2019 a las 19 hs.
Aula 9, Pabellón 1 de Ciudad Universitaria, CABA
Facultad de Ciencias Exactas y Naturales, UBA
El Procesamiento del Lenguaje Natural (PLN), del inglés Natural Language Processing (NLP), es un campo de la Inteligencia Artificial, quizás uno de los más conocidos. Actualmente la necesidad de traducción automática, análisis del lenguaje, discurso y textos no estructurados en diversos formatos como así también la necesidad de crear sistemas capaces de aprender sin intervención humana, explican el auge de un campo que requiere un enfoque transversal desde la ciencia de datos.
En este panel, expertos de la industria contarán cuáles son los principales desafíos y problemas del NLP y cómo el aprendizaje automático ha revolucionado la manera de tratar estos problemas.
Procesamiento de lenguaje natural de textos jurídicos
HORACIO ROBERTO GRANERO (Presidente de Albremática) y PABLO ANDRIBET (CTO de elDial.com)
Resumen: En esta presentación se contarán los pasos realizados por la empresa en el camino para lograr una herramienta que procese lenguaje natural para el área del Derecho, analizando los textos de los sumarios de los fallos de la jurisprudencia en base a preguntas realizadas por los usuarios.
![]() |
_ |
|
![]() |
_ |
|
Por ejemplos
DAN ROZENFARB (Director I+D de Keepcon) y MATÍAS EGEA (Team Leader I+D de Keepcon)
Resumen: Te dan un lote de 100K contenidos de redes sociales. Tu misión es presentarle un resumen automático al cliente. ¿Cómo hacés?
![]() |
_ |
|
![]() |
_ |
|
Desafíos para el Procesamiento del Lenguaje Natural (NLP) en el Lenguaje de la Medicina
JOSÉ CASTAÑO (Experto en NLP aplicada en Medicina, Hospital Italiano de Buenos Aires)
Resumen: En esta charla se abordarán los desafíos y el modo de enfrentarlos por parte del Hospital Italiano de Buenos Aires. La información digitalizada en la Historia Clínica Electrónica (HCE) contiene textos generados por los profesionales médicos. Estos textos presentan dificultades para el PLN que no se encuentran en otros dominios. Estos desafíos involucran tanto el uso de terminología propia extendida, de abreviaturas y siglas, presencia de typos y errores ortográficos, y una sintaxis telegráfica, entre otros.
![]() |
_ |
José Castaño es experto y desarrollador en el campo de NLP en el Departamento de Informática en Salud del Hospital Italiano de Buenos Aires. Profesor en Letras (UBA), especializado en Lingüística Formal. Doctorado en Ciencias de la Computación, Brandeis University (USA). Post-Doctorado en Ciencias de la Computación (Brandeis University) en el área de procesamiento del lenguaje natural para bio-medicina. Project Manager e Investigador Principal en proyectos del área. Fue Profesor e Investigador del Departamento de Computación de la Facultad de Ciencias Exactas y Naturales y Profesor de la Maestría en Data Mining, ambos cargos desempeñados en la Universidad de Buenos Aires. |
Para acceder a las conversaciones sobre ciencia de datos:
Conversaciones sobre Ciencia de Datos - 3ra Edición (2019)
Conversaciones sobre Ciencia de Datos - 2da Edición (2018)
Conversaciones sobre Ciencia de Datos - 1ra Edición (2017)
Archivo de los ciclos anteriores, Hablemos de Big Data:
Hablemos de Big Data - 3ra Edición (2016)
Hablemos de Big Data - 2da Edición (2015)
Hablemos de Big Data - 1ra Edición (2014)