#5 Más allá de la IA Generativa: la IA Discriminativa y la detección de entidades
Durante los últimos años no paramos de hablar sobre la IA generativa y sus prometedoras aplicaciones. En parte, debido a lo seductor que resulta el hecho de que una máquina, por sí sola y con un simple input -el prompt-, sea capaz de generar un contenido nuevo, ya sea en forma de texto, imagen o video. Pero por mucho que el wow effect de los modelos de aprendizaje automático o Machine Learning (ML) generativos sea incuestionable, a la hora de la verdad no es la generación de contenido el problema más común del operador jurídico que podemos solucionar con tecnología y, en particular, con IA. Y cuando hablo de problema en el contexto de esta newsletter, me refiero a las partes del quehacer jurídico que resulten tediosas, y por lo tanto deseosas de ser automatizables de algún modo.
En este sentido, te invito a que aparquemos por un momento el hype entorno a la IA generativa, para hablar sobre el modelo de ML que estará probablemente más presente detrás de la mayoría de softwares que usaremos los asesores jurídicos a la hora de llevar a tareas relacionadas con la gestión de departamentos legales. Acompáñame para adentrarnos en el concepto de la IA discriminativa y una de sus principales aplicaciones.
¿Qué es la IA discriminativa y en qué se diferencia de la IA generativa?
Existen dos tipos de modelos de ML: los modelos de IA discriminativa y los modelos de IA generativa. En términos sencillos, un modelo discriminativo hace predicciones para resolver problemas de clasificación o de obtención de valores (conocidos como problemas de regresión), aunque nos centraremos principalmente en los problemas de clasificación dada su proximidad con el caso de uso jurídico que veremos a continuación. En cambio, un modelo generativo se concentra en cómo se distribuyen los datos para calcular la probabilidad de un ejemplo específico, como hemos explorado en artículos anteriores (en la oración “el gato se cayó del […]” es más correcto, desde un punto de vista probabilístico matemático, que la frase termine con “árbol” que “del cielo”).
El caso de uso clave en soluciones legal tech: la detección de entidades o Entity Detection
Para ilustrar de una forma más clara cuanto vengo exponiendo (y aprovechando que el boom de IA generativa ha acercado tanto la disciplina al público general), veamos uno de los casos de uso clave a la hora de integrar la IA en soluciones legal tech: Entity Detection.
Como su propio nombre indica, este caso de uso o funcionalidad consiste en detectar entidades dentro de un texto, como vendrían siendo fechas, nombres de partes, números de identificación, precios, hasta incluso aspectos de cláusulas concretas sobre los que exista una voluntad de supervisión, por ejemplo una cesión de derechos dentro de un contrato. De este modo, un modelo discriminativo entrenado para detectar entidades como las que acabo de citar, estaría preparado para extraer esos datos de forma automatizada dentro de un conjunto de documentos. De ahí los términos “clasificación” o “discriminación” (en el sentido del que aquí hablamos), pues el modelo es capaz de discriminar dentro de un conjunto de datos no estructurado (vamos, lo que vendría siendo un documento) lo que son entidades de lo que no lo son. La cuestión de cómo se efectúa el entrenamiento de estos modelos la dejo para otra ocasión, pues es algo que toco especialmente de cerca en mi trabajo, y también puede resultar de interés bajo mi punto de vista.
Recomendado por LinkedIn
Veámoslo más a fondo: Entity Detection para la gestión de demandas masivas
Voy a intentar ilustrarlo todavía más, y para quedarme bien a gusto, lo haré con una tarea que tuve que llevar a cabo durante mi experiencia en la consultora Indra: la gestión de demandas masivas sobre productos financieros. En este caso, el departamento de servicios jurídicos financieros para el que trabajaba tenía que realizar la tarea de gestionar las casi 400 demandas diarias sobre contratos hipotecarios que recibía la entidad bancaria cliente. Para tramitar esas demandas y poderlas contestar en plazo, era necesario identificar los clientes de la entidad que estaban demandando, acceder a su terminal financiero, e ir recabando la documentación asociada a la hipoteca para preparar la contestación. Dado que el volumen de demandas era elevadísimo, y su objeto no era siempre el mismo, teníamos que introducir una serie de datos clave de la demanda en un software vinculado al terminal financiero de la entidad. Algunos ejemplos de estos datos eran el importe objeto de la reclamación, la/s cláusula/s impugnada/s, o la fecha de suscripción del préstamo, entre otros datos.
No sé cómo se hace ahora, pero por lo menos en 2021 hacíamos ese trabajo de forma manual. Nos dividíamos en equipos por tipo de cláusula impugnada, y venga, a gestionar de 10 a 15 demandas diarias por persona. Como os podréis imaginar, se trataba de un trabajo fácil y a la vez duro debido a su carácter monótono. Costaba mucho mantener la concentración pasadas unas horas, y la sensación de realización (por lo menos en mi caso y si omitimos la parte de gestión de equipos y personas) era mínima. Pero es que aun hay más. Todo ese trabajo había luego que auditarlo de forma aleatoria para asegurar que los datos volcados en el software se correspondían con la realidad, además de para cumplir con el acuerdo de nivel de servicio correspondiente que la consultora tenía con la entidad bancaria.
Pues sí, un modelo discriminativo sirve exactamente para eso. Y como os podréis imaginar, si está bien entrenado, no sólo puede hacer ese trabajo de forma casi instantánea, sino con un grado de precisión en algunos casos mayor que el resultante de las auditorías que practicábamos. Y no, aunque quizás algunos pensarán lo contrario, no se trata de destruir empleo, porque no conocí a nadie allí que se sintiera realizado a la hora de llevar a cabo esa tarea. Para mí, el paradigma de lo que debería automatizarse, y no la redacción de un contrato o el planteamiento de la estrategia de un caso.
Modelos híbridos entre IA generativa e IA discriminativa
Para rizar todavía más el rizo, a la hora de crear soluciones existe también la posibilidad de hacer una combinación de modelos. Imaginémonos hacer uso de uno discriminativo para procesar y clasificar datos; y otro generativo para dirigirnos al sistema. Por ejemplo, poder preguntar a una base de datos de contratos, lo siguiente: “Genérame un listado de los contratos suscritos por la empresa cuya cuantía anual sea superior a 100.000 euros, que contengan obligaciones de no competencia tras el vencimiento superiores a un año, y que venzan en un periodo de entre 3 y 6 meses”. Ahí el modelo generativo procesaría ese prompt de entrada para preparar una respuesta en forma de listado, una vez obtenidos esos datos del resultado generado por el modelo discriminativo. En pocas palabras, que las posibilidades son infinitas.
Conclusión
Al fin y al cabo, como termina sucediendo siempre en tecnología, se sobreestiman las posibilidades en el corto plazo pero si infravaloran en el largo. Eso mismo sucede ahora con la IA generativa, que estamos todos deslumbrados por el hecho de que, por primera vez, una tecnología es capaz de crear algo nuevo, pero, en la práctica, no tiene porque ser esta la tecnología que nos ayude de verdad a solucionar los verdaderos problemas, que bajo mi punto de vista son las tareas que los humanos no queremos hacer.
Por tanto, superada ya esa fase de hype inicial, el enfoque más pragmático a la hora de integrar IA en productos digitales para el sector legal, quizás pase más por IA discriminativa que por IA generativa, por mucho que cuando vislumbramos IA en la profesión, nuestras mentes se vayan directas a los problemas que más recursos mentales nos requieren: la tarea creativa, como la redacción de un contrato nuevo, encontrar un precedente judicial muy concreto y aplicarlo a una situación de hecho determinada, o plantear correctamente la estrategia de un caso complejo transfronterizo. Por mucho que estemos agotados por la profesión, ¿realmente queremos (y resulta realista siquiera plantearlo) que sean esas las tareas que queremos suplir mediante automatización?
IP & IT Lawyer at SOL MUNTAÑOLA ABOGADOS. Delegado de Protección de Datos Certificado (DPD/DPO).
10 mesesArtículo destacable! ¡Gracias Ferran!