Competencia de extracción de información de informes de radiología en español (SpRadIE)

*** Llamada para participación en SpRadIE: Competencia de extracción de información de informes de radiología en español (CLEF EHealth 2021. Tarea 1) ***

Reconocimiento de entidades nombradas y marcadores de modalidad en informes radiológicos escritos en español

https://sites.google.com/view/spradie-2020

Estamos organizando SpRadIE, la primera tarea compartida centrada específicamente en el reconocimiento de entidades nombradas y en la detección de marcadores de modalidad (hedges) en registros clínicos escritos en español, específicamente informes radiológicos. SpRadIE es parte de la iniciativa CLEF eHealth 2021 (Tarea 1).

Información importante

1. Sitio web de SpRadIE, información y descripción detallada

2. Inscripción a SpRadIE (Tarea1 de CLEFeHealth). Hay que inscribirse para poder participar!

3. Conjunto de entrenamiento y desarrollo. Para obtenerlo, hay que llenar el siguiente formulario y tomar nota de la URL que se provee al final.

4. Scripts de evaluación: aquí.

 

Motivación de la tarea

El constante crecimiento de la digitalización de datos clínicos, principalmente en formato textual, ha motivado un aumento de la atención prestada a las tareas de extracción de información en textos biomédicos (BioNLP). Esta información permite la mejora de los procesos sanitarios y de toma de decisiones.

Entre otras dificultades, la extracción de información en el ámbito clínico tiene que lidiar con vocabulario local y altamente especializado, con abundancia de abreviaturas no estándares y ambiguas y oraciones de estilo telegráfico. Además, la existencia de datos anotados de acceso público es escasa, debido al costo asociado a su anotación y por tratarse de datos sensibles.

El español es el segundo idioma en términos de número de hablantes nativos en el mundo y los informes clínicos en los países de habla hispana están escritos en español. Sin embargo, existe poco trabajo sobre la extracción de información de los informes médicos escritos en dicho idioma.

Para la extracción de información en informes médicos, es fundamental el reconocimiento de entidades nombradas y de marcadores de modalidad. En esta competencia, proponemos la identificación de las principales entidades nombradas presentes en los informes radiológicos escritos en español. Por otro lado, más del 50% de los hallazgos clínicos mencionados en los informes están negados o puestos en duda. Por lo tanto, la identificación de marcadores de modalidad también es de suma importancia.

Mediante esta tarea, compartimos nuestros datos anotados con el fin de difundir la existencia de este problema, y de animar a los investigadores y estudiantes a aportar soluciones creativas, y así, poder avanzar en la extracción de información en textos escritos en español en el área de dominio biomédico.

Fechas importantes

15 de Febrero de 2021: Publicación del corpus de entrenamiento

15 de Marzo de 2021: Publicación del corpus de desarrollo

15 de Marzo de 2021: Publicación de los scripts de evaluación

16 de Abril de 2021: Publicación del corpus de test

30 de Abril de 2021: Cierra la inscripción

1 de Mayo de 2021: Fecha límite para el envío de resutados

14 de Mayo de 2021: Publicación de resultados

26 de Mayo de 2021: Fecha límite para el envío de los artículos científicos (papers) de los participantes

11 de Junio de 2021: Notificación de aceptación de los papers de los participantes [CEUR-WS]

2 de Julio de 2021: Copia de camera ready de los papers de los participates

Septiembre: Sesión de CLEF eHealth 2021. Un día de duración.

 

Para obtener mayor información de fechas, por favor chequear el sitio de CLEF eHealth:

https://clefehealth.imag.fr/?page_id=608&

Publicaciones

Los participantes del desafío están invitados a enviar la descripción y los resultados de sus sistemas para que se publiquen en las actas de CLEF eHealth. Habrá un workshop en CLEF eHealth, donde los equipos participantes podrán presentar sus soluciones y resultados.

Organizadores

  • Viviana Cotik, Universidad de Buenos Aires (UBA), ICC CONICET, Argentina
  • Laura Alonso Alemany, Universidad Nacional de Córdoba (UNC), Argentina
  • Roland Roller, Deutsches Forschungszentrum für Künstliche Intelligenz (DFKI), Germany
  • Franco Luque, Universidad Nacional de Córdoba (UNC), CONICET, Argentina
  • Jorge Vivaldi, Universidad Pompeu Fabra, Spain
  • Darío Filippo, Hospital «Prof. Dr. Juan P. Garrahan», Argentina

Foro: SpRadIE@googlegroups.com

Lista de mail de los organizadores: SpRadIEOrganizers@googlegroups.com

Twitter: @rad_ie

Facebooktwitterlinkedin

Dejá un comentario

Tu dirección de correo electrónico no será publicada. Los campos necesarios están marcados *