Presentando DocuMentor y algunas consideraciones sobre los RAG

Daniel Betancur

Lead Data Scientist | M.Sc. in Statistical Science

Fecha de publicación: 8 oct 2024

DocuMentor es una solución de IA que utiliza una arquitectura RAG (Retrieval Augmented Generation) para buscar información eficientemente en documentos PDF. DocuMentor te permite hacer preguntas sobre artículos académicos en PDF y obtener respuestas precisas, permitiéndote descubrir rápidamente en que documentos se explora o no un concepto específico, obtener información sobre ideas centrales o despejando dudas específicas sobre algunos conceptos. Si bien como asistente DocuMentor resulta funcional al desplegarlo (las indicaciones se encuentran en el repositorio) el objetivo principal de este artículo es servir como un punto de referencia para los entusiastas de la IA que quieran profundizar en estos conceptos o que puedan valerse de los conceptos y el código del proyecto para sus propios desarrollos.

Esto da paso a hablar sobre el origen del proyecto: DocuMentor fue creado como proyecto final del LLM Zoomcamp, una iniciativa de enseñanza gratuita sobre temas de inteligencia artificial generativa y RAG que recomiendo a todos los que sientan interés por el tema y les gustaría comenzar con un entendimiento más profundo. Si bien es posible encontrar herramientas como Llama Index y Langchain que facilitan la construcción de este tipo de arquitecturas en gran medida, el enfoque del curso, más orientado a una construcción desde lo básico, toca los siguientes temas a considerar en el desarrollo de este tipo de arquitecturas cuyo entendimiento es sumamente relevante:

Funcionamiento de la búsqueda vectorial y el caso particular de la búsqueda semántica.
Evaluación del desempeño de los algoritmos de búsqueda.
Evaluación del desempeño de los RAG.
Monitoreo de los RAG.

En el proyecto pueden encontrarse implementaciones de todos estos temas, así como algunos aportes desde mi experiencia en investigación. Algunos temas a resaltar son:

Instrucciones para un despliegue ágil utilizando docker-compose
Notebooks que exploran el tema del preprocesamiento de documentos, principalmente orientados a cómo segmentar los documentos y considerando enfoques como la división proposicional y la división secuencial semántica.
Experimentos de búsqueda híbrida, ajuste de hiperparámetros y evaluación de algoritmos de búsqueda y de la relevancia de las respuestas de los RAG.
Código para el front con node.js.
Despliegue de una base de datos de retroalimentación con postgres y de un entorno de monitoreo con Grafana.

Presentando DocuMentor y algunas consideraciones sobre los RAG

Daniel Betancur

Lead Data Scientist | M.Sc. in Statistical Science

Recomendado por LinkedIn

Más artículos de este autor

Otros usuarios han visto

CodePlan: Innovando en la Automatización de Códigos a Nivel de Repositorio con IA Avanzada

Algoritmos, Pseudocódigo y Diagramas de Flujo

Gráficos Interactivos para el aprendizaje de estadística

OOP 4 nwbs- Estructuras de datos

Compiladores Inteligentes: El Futuro del Desarrollo con IA y Pseudocódigo

Las Mejores Herramientas y Frameworks para Desarrolladores Backend en IA

Mermaid a PNG con IA

Cosine Genie: ¿Será una IA el futuro de la ingeniería de software?

Algoritmos con Estructuras de Datos: La base fundamental de la programación

Ver temas