Un asistente de inteligencia artificial para el derecho argentino

Investigadores locales están trabajando en el desarrollo de un asistente de inteligencia artificial (IA) experto en temas de abogacía. Se trata de Edgar Altszyler (Investigador del LIAA-ICC, Profesor de la Maestría en Ciencia de Datos y Consultor de IA), David Mielnik (Abogado y Profesor de la Universidad Torcuato Di Tella) y Francisco Valentini (Doctorando en Ciencias de la Computación en el LIAA-ICC). El propósito de estos científicos de datos es lograr que la aplicación pueda responder preguntas legales complejas y hacerlo rigurosamente a partir de una base de datos real de la jurisprudencia argentina.

A fines del año 2022 la empresa Open AI lanzó la versión de prueba gratuita de una herramienta de inteligencia artificial denominada ChatGPT, un programa informático que simula y procesa conversaciones humanas y está entrenado para responder casi cualquier pregunta o consigna que se le dé. La aplicación está impactando en muchísimas industrias y actividades productivas, y el área de legales no es la excepción.

Aproximadamente seis meses después de que OpenAI presentara el prototipo de ChatGPT para uso público, muchos abogados en los Estados Unidos, el Reino Unido y Canadá ya conocen la herramienta y lo que puede hacer. Recientemente una encuesta de Thomson Reuters evidenció que un 75% de los letrados cree que ChatGPT y su tecnología general, la inteligencia artificial (IA) generativa, se puede aplicar fácilmente al trabajo legal, mientras que más del 50% cree que debería usarse para el trabajo legal. Un detalle relevante es que GPT-4 (la versión mejorada de ChatGPT) aprobó el examen de finalización de la carrera de derecho en Estados Unidos, superando ampliamente a un estudiante de abogacía promedio y acercándose al percentil 90.

Actualmente el equipo coordinado por Edgar Altszyler -Investigador del Laboratorio de Inteligencia Artificial Aplicada LIAA ICC , Profesor de la Maestría en Ciencia de Datos y Consultor de IA- se encuentra estudiando el tópico de aplicaciones jurídicas en la inteligencia artificial generativa. Y expone que el uso actual en abogacía de la última versión de ChatGPT, GPT-4, así como está configurado, demuestra claros problemas y le falta una “vuelta de tuerca” para que resulte confiable:

1)    Falsedades: GPT-4 tiene la habilidad de generar texto coherente pero no tiene por qué ser verídico. Entonces en algunas ocasiones inventa datos. GPT-4 escribe textos que es probable que hayan sido dichos por un humano, pero no chequea lo que dice, las fuentes de lo que dice. “Son alucinaciones porque devuelve datos falsos. Es algo inherente al modelo y GPT-4 no tiene manera de salir de este problema”, puntualiza Altszyler.

2)    Limitación de datos: GPT-4 está limitado a los datos con que fue entrenado. Entonces no tiene acceso a toda la jurisprudencia argentina (o a la de otros países) y no tiene por qué saber de nuestras leyes. Probablemente posea muchos más datos jurídicos de Estados Unidos que de otros países del mundo.

3)    Ausencia de citas o referencias válidas: Considerando que GPT-4 no sabe de dónde aprendió lo que aprendió, no puede incluir citas en su texto. “No te da una referencia válida de un artículo para sustentar lo que dice. Simplemente te responde, le preguntás y sigue respondiendo. Realmente no sabés si es verdad lo que dice y no sabés de dónde sacó la información. Esto genera una limitación en los usos reales que pueden hacer los abogados de la aplicación”, agrega el investigador. De hecho un abogado estadounidense se enfrenta a posibles sanciones después de haber usado ChatGPT para redactar un escrito y descubrirse que la aplicación se había inventado toda una serie de supuestos precedentes legales.

Teniendo en cuenta estas limitaciones, el equipo coordinado por Altszyler implementó una nueva técnica denominada Retrieval-Augmented Language Model o Retrieval-Augmented Generation, para usar GPT-4 como servicio, cuyo valor agregado es sumar información real de una base de datos a las respuestas. “Primero hacés una pregunta, vas a hacer una búsqueda a tu base de datos que tiene los datos reales de la jurisprudencia argentina para ver dónde están los elementos relevantes para responder esa pregunta, de la cual después alimentás al asistente para que la respuesta se base en la información extra que estás aportando”, explica Altszyler.

La vuelta de tuerca de esta aplicación es que además uno puede sumar links a los elementos de la respuesta de ChatGPT, según de dónde surgió la información relevante. Entonces en este caso resolvimos los problemas de veracidad, le incorporamos datos reales (toda la jurisprudencia y leyes argentinas), y también tiene citas o referencias reales que se pueden usar en las respuestas”, argumenta el investigador y profesor de la Maestría. De ese modo, el asistente de IA va a responder la pregunta exclusivamente en el contexto de la base de datos reales aportada por los investigadores, no lo hará con datos que no estén chequeados. Así, toda la comunidad jurídica se beneficiará en el uso profesional de este asistente de IA, el primero que se desarrolla con usos jurídicos.

El equipo ya realizó pequeñas pruebas de la aplicación y funciona muy bien. “Hoy en día esto se está implementando en otras áreas de la industria (con empresas que pueden acceder fácil y rápido a los datos internos propios de productos, servicios o clientes). Es realmente una revolución el uso de ChatGPT con datos propios, no es algo que nosotros inventamos. Pero vamos a ser los primeros en desarrollarlo para el derecho argentino. Lo que está subestudiado es cómo hacer estas conexiones entre ChatGPT y una base de datos extra, hay muy poca bibliografía científica o cantidad de casos sobre cómo optimizar estos usos y dónde están las limitaciones u oportunidades de los textos por lo que también usaremos esta experiencia para generar publicaciones científicas del tema”, aclara Altszyler.

Con respecto a futuros usos para el ámbito jurídico local, considerando que un asistente de IA tiene la capacidad de emular el razonamiento humano y responder sobre cuestiones complejas, uno podría contarle a la aplicación todos los hechos de un caso y podría pedirle que opine los motivos a favor, los motivos en contra, qué elementos cree que hay que tener en cuenta, cuáles son los elementos principales y qué tipo de información adicional debería tener en cuenta un abogado o un juez para complementar la toma de decisiones sobre lo que ya opinaba anteriormente del caso. De este modo, el profesional de las ciencias jurídicas puede interactuar preguntándole a ChatGPT ciertas cosas y después lo chequea. Pero esta búsqueda de información se haría siempre de manera conversacional, no como una búsqueda en Google o Wikipedia.

Creo que la abogacía debería ser una de las áreas con más impacto en IA, con todas las nuevas tecnologías que se desarrollan. Claramente la IA es muy rica procesando texto, extrayendo información relevante, tomando decisiones, resumiendo y encontrando elementos importantes en cada texto jurídico”, precisa Altszyler. Teniendo en cuenta que gran parte del derecho sucede en los papeles, al poder reunir muchos textos y datos jurídicos digitalizados (favorecido por la Ley Nacional 26856 que establece que todos los tribunales en segunda instancia, como cámaras de apelación y tribunales orales, tienen que publicar todas las decisiones que emiten) se estima que gran parte del esfuerzo de los abogados puede ser acelerado por la IA.

Dr. Edgar Altszyler

Por último, Altszyler afirma que el propósito de su grupo de investigadores es mantenerse a la vanguardia de estas preguntas científicas, que se encuentran en la frontera entre la investigación y la industria. “Uno de los pedidos principales que tenemos de transferencia tecnológica es implementar estos asistentes de IA basados en datos reales. Nosotros abordamos un interrogante abierto de investigación a partir de una herramienta que está cambiando el mundo e impactando en todas las industrias, no sólo en la industria legal”. Al mismo tiempo, complementa que ya han trabajado en otro proyecto que utiliza el modelado de tópicos (topic modeling) para generar un estudio a gran escala de lo que está sucediendo hoy en día en la jurisprudencia argentina: analizar el contenido textual de la jurisprudencia Argentina en los últimos veinte años (un dataset de 115.861 sentencias judiciales, pronunciadas por la Cámara Federal de Casación Penal desde 1992 hasta 2022) y extraer patrones y reglas latentes en la toma de decisión concreta de los juzgados. Este proyecto se encuentra en proceso de publicación.

El equipo de investigadores

Edgar Altszyler

El Dr. Edgar Altszyler es consultor de IA, investigador del CONICET en el Laboratorio de Inteligencia Artificial Aplicada, UBA y profesor de Procesamiento de Lenguaje Natural en la Maestría en Ciencia de Datos, UBA.  El Dr. Altszyler es Licenciado en Física del Instituto Balseiro y doctor en Física de la UBA.

David Mielnik

David Mielnik es abogado y máster en derecho penal (UTDT). Desde 2013 es profesor titular de Derecho Penal I y II, y desde 2022, de Análisis Computacional del Derecho y Legal Analytics en la carrera de abogacía.

Francisco Valentini

Francisco Valentini es Licenciado en Economía (FCE-UBA) y Especialista en Explotación de Datos (FCEN-UBA). Actualmente es estudiante de Doctorado en Computación (FCEN-UBA) y docente de grado en el Instituto Tecnológico de Buenos Aires (ITBA). Trabaja en Procesamiento del Lenguaje Natural aplicado.

7 respuestas a “Un asistente de inteligencia artificial para el derecho argentino”

  1. Melina dice:

    Me gustaría saber cuando se publicará el libro en cualquiera de sus formas con toda la investigación realizada así lo compro o me suscribo. Dejo mi el email para contacto. Saludos cordiales

  2. Metaabogada Inteligente (Victoria) dice:

    Soy Abogada Cibercuántica e IA. Además, Investigadora de Tecnología y Derecho. Manejo de Ciencias de Datos. Análista de Datos. Blockchain. Economía, Finanzas y Tributario. Criptomonedas (divisas virtuales, divisas fiduciarios y criptoactivos; NFTs y Game. Contract Smart). Me interesa la propuesta. Todo lo que se a explicado científicamente es así. Lo he comprobado. WhatsApp 1130237183🇦🇷♎

  3. jonathan dice:

    hola ya tiene alguna beta para probar estoy interesado en testear no soy estudioso en tema legal pero soy tecnico informático

    • Predictivos dice:

      Estimado, debería intentar comunicarse con el Dr. David Mielnik. Él es uno de los principales responsables de la iniciativa. Gracias

  4. Cristian dice:

    Estimados quisiera saber si ya tienen el programa para comenzar a usarlo y valores

    • Predictivos dice:

      Estimado, debería intentar comunicarse con el Dr. David Mielnik. Él es uno de los principales responsables de la iniciativa. Gracias

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *