ChatGPT es un modelo de lenguaje no un sistema de clasificación como FastText por ejemplo
ChatGPT y FastText son dos herramientas con características y propósitos fundamentales diferentes, aunque ambos pueden ser aplicados en contextos de procesamiento de lenguaje natural. Vamos a explorar sus diferencias en relación con la codificación de diagnósticos y procedimientos médicos con CIE-10-ES.
Al final de lo que se trata es de generar códigos correctos (que sean semánticamente aceptables) y precisos (que sean finales) CIE-10-ES desde textos escritos en leguaje natural. Simple no!
ChatGPT
Naturaleza
Es un modelo de lenguaje basado en la arquitectura Transformer (específicamente, una variante del modelo GPT de OpenAI).
Su uso principal es la generación de texto, comprensión del lenguaje natural, respuestas a preguntas, entre otros.
Aplicación en CIE-10-ES
ChatGPT podría ser entrenado o afinado para comprender y "codificar" descripciones médicas en códigos CIE-10-ES, y puede interactuar de forma natural con los usuarios para aclarar o solicitar más información sobre diagnósticos o procedimientos, y cosas como los sinónimos, notas, inclusiones, exclusiones, si son códigos terminales, ... etc.
ChatGPT puede servir perfectamente para consultas y razonamiento sobre códigos pero no como sistema de codificación automática a mi juicio por lo de siempre: "alucina" y no te puedes fiar de los resultados.
El caso de uso mas claro es el de la consulta con fines de formación, y entrenamiento de documentalitas, o consulta para resolver dudas de codificadores. Otro caso de uso podría ser para la codificación origen es decir que los médicos directamente consulten la CIE usando una interfaz interactivo tipo ChatBot que codifique además de buscar y encontrar los conceptos clínicos que represente el caso de consulta.
Ventajas
Puede manejar instrucciones complejas y contexto, ofrecer respuestas en lenguaje natural y ser integrado en sistemas interactivos.
Desventajas
Necesita una gran cantidad de datos y poder computacional para entrenamiento y afinado. No está diseñado específicamente para la codificación, por lo que puede requerir ajustes específicos para este propósito. No es muy fiable porque puede "alucinar" en las respuestas
Recomendado por LinkedIn
FastText
Naturaleza
Es una biblioteca desarrollada por Facebook AI Research (FAIR) para aprender representaciones de palabras (embedings) y realizar clasificación de texto.
Uso principal
Clasificación de texto y representación de palabras (word embeddings).
Aplicación en CIE-10-ES
FastText se puede utilizar para codificar descripciones médicas en códigos CIE-10-ES tratando cada código como una "clase". Las descripciones médicas se representarían como vectores y se clasificarían en la categoría (código) correspondiente.
Habría que entrenarlo con millones de historias clínicas escritas en lenguaje natural y sus correspondientes CMBDs codificados con humanos.
FastText encontraría las reglas internas de forma desatendida si tiene suficientes ejemplos de cada tipo de informe llegando a una probabilidad de acierto muy grande +80% si se compara con la codificación humana. Con la salvedad de que dos codificadores no codifican un episodio medianamente complejo de igual forma y que no siempre tienes la información disponible como las notas de enfermería, anatomía patológica, etc., disponibles.
Ventajas
Es eficiente y rápido, especialmente útil para clasificación de texto en grandes conjuntos de datos. Es capaz de representar palabras fuera de su vocabulario por su capacidad de trabajar con subcadenas de palabras.
Con FastText se pueden codificar automáticamente diagnóstico y procedimientos médicos porque dependen úncamente de tener una profundidad histórica grande de millones de conjuntos CMBD y su informe de HCE correspondiente para ser eficiente. Obviamente si no hay suficiente ejemplos de un determinado caso pues no va a funcionar. De todas forma el estado del arte actual requiere supervisión humana, yo no lo dejaría al sistema funcionando solo de momento.
Desventajas
No maneja contexto de la misma manera que los modelos basados en Transformers, y su capacidad para comprender y generar lenguaje es más limitada.
Conclusión
Mientras que ChatGPT es más adecuado para interacciones en lenguaje natural y puede ser útil en sistemas interactivos de codificación, FastText es más directo y eficiente para la clasificación de texto, lo que podría hacerlo adecuado para codificar rápidamente descripciones en códigos específicos. La elección entre uno y otro dependería de la aplicación específica, los recursos disponibles y el nivel de interacción deseado con el usuario.