Los clientes necesitan una mayor precisión para llevar a producción aplicaciones de IA generativa. En un mundo donde las decisiones se basan cada vez más en datos, la integridad y confiabilidad de la información son primordiales. Para abordar esto, los clientes a menudo comienzan mejorando la precisión de la IA generativa a través de sistemas de recuperación basados en vectores y el patrón arquitectónico de Generación Aumentada de Recuperación (RAG), que integra incrustaciones densas para conectar a tierra las salidas de IA en un contexto relevante. Cuando se requiere una precisión aún mayor y fidelidad contextual, la solución evoluciona hacia RAG mejorado con gráficos (GraphRAG), donde las estructuras de gráficos brindan capacidades mejoradas de razonamiento y modelado de relaciones.
letriasocio de AWS, demostrado que la integración de estructuras basadas en gráficos en los flujos de trabajo de RAG mejora la precisión de las respuestas hasta en un 35% en comparación con los métodos de recuperación de solo vectores. Esta mejora se logra utilizando la capacidad del gráfico para modelar relaciones y dependencias complejas entre puntos de datos, proporcionando una base más matizada y contextualmente precisa para los resultados de IA generativa.
En esta publicación, exploramos por qué GraphRAG es más completo y explicable que el RAG vectorial solo, y cómo puede utilizar este enfoque utilizando los servicios de AWS y letria.
Cómo los gráficos hacen que RAG sea más preciso
En esta sección, analizamos las formas en que los gráficos hacen que RAG sea más preciso.
Capturando consultas humanas complejas con gráficos
Las cuestiones humanas son intrínsecamente complejas y a menudo requieren la conexión de múltiples piezas de información. Las representaciones de datos tradicionales luchan por adaptarse a esta complejidad sin perder contexto. Sin embargo, los gráficos están diseñados para reflejar la forma en que los humanos piensan y hacen preguntas de forma natural. Representan datos en un formato legible por máquina que preserva las ricas relaciones entre entidades.
Al modelar datos como un gráfico, se captura más contexto e intención. Esto significa que su aplicación RAG puede acceder e interpretar datos de una manera que se alinea estrechamente con los procesos de pensamiento humano. El resultado es una respuesta más precisa y relevante a consultas complejas.
Evitar la pérdida de contexto en la representación de datos.
Cuando confía únicamente en la similitud de vectores para la recuperación de información, se pierden las relaciones matizadas que existen dentro de los datos. Traducir el lenguaje natural a vectores reduce la riqueza de la información, lo que potencialmente conduce a respuestas menos precisas. Además, las consultas de los usuarios finales no siempre están alineadas semánticamente con la información útil de los documentos proporcionados, lo que lleva a que la búsqueda vectorial excluya puntos de datos clave necesarios para generar una respuesta precisa.
Los gráficos mantienen la estructura natural de los datos, lo que permite un mapeo más preciso entre preguntas y respuestas. Permiten que el sistema RAG comprenda y navegue por las intrincadas conexiones dentro de los datos, lo que mejora la precisión.
Lettria demostró una mejora en la exactitud de las respuestas del 50 % con RAG tradicional a más del 80 % usando GraphRAG dentro de un enfoque híbrido. Las pruebas cubrieron conjuntos de datos de finanzas (informes financieros de amazon), atención médica (estudios científicos sobre vacunas COVID-19), industria (especificaciones técnicas para materiales de construcción aeronáutica) y derecho (directivas de la Unión Europea sobre regulaciones ambientales).
Demostrando que los gráficos son más precisos
Para fundamentar las mejoras en la precisión del RAG mejorado con gráficos, Lettria llevó a cabo una serie de evaluaciones comparativas comparando su solución GraphRAG, un RAG híbrido que utiliza almacenes de gráficos y vectores, con una referencia RAG de referencia solo vectorial.
La metodología híbrida de Lettria a RAG
El enfoque híbrido de Lettria para responder preguntas combina lo mejor de la similitud de vectores y la búsqueda de gráficos para optimizar el rendimiento de las aplicaciones RAG en documentos complejos. Al integrar estos dos sistemas de recuperación, Lettria utiliza precisión estructurada y flexibilidad semántica para manejar consultas complejas.
GraphRAG se especializa en el uso de datos contextuales detallados, ideales para responder preguntas que requieren conexiones explícitas entre entidades. Por el contrario, vector RAG destaca en la recuperación de información semánticamente relevante y ofrece conocimientos contextuales más amplios. Este sistema dual se ve reforzado aún más por un mecanismo alternativo: cuando un sistema tiene dificultades para proporcionar datos relevantes, el otro lo compensa. Por ejemplo, GraphRAG señala relaciones explícitas cuando están disponibles, mientras que el vector RAG llena los vacíos relacionales o mejora el contexto cuando falta una estructura.
El proceso de evaluación comparativa
Para demostrar el valor de este método híbrido, Lettria llevó a cabo extensas evaluaciones comparativas en conjuntos de datos de diversas industrias. Utilizando su solución, compararon el proceso híbrido de GraphRAG con un paquete RAG líder de código abierto, Verba de Weaviateuna referencia RAG básica que depende únicamente de almacenes de vectores. Los conjuntos de datos incluían informes financieros de amazon, textos científicos sobre las vacunas contra la COVID-19, especificaciones técnicas de la aeronáutica y directivas medioambientales europeas, lo que proporcionó un banco de pruebas diverso y representativo.
La evaluación abordó la complejidad del mundo real centrándose en seis tipos distintos de preguntas, incluidas consultas basadas en hechos, de múltiples saltos, numéricas, tabulares, temporales y de múltiples restricciones. Las preguntas iban desde una simple investigación de hechos, como identificar fórmulas de vacunas, hasta tareas de razonamiento de varios niveles, como comparar cifras de ingresos en diferentes períodos de tiempo. Un ejemplo de consulta de múltiples saltos en finanzas es “Compare los ingresos de amazon reservados más antiguos con los más recientes”.
El equipo interno de Lettria evaluó manualmente las respuestas con una tabla de evaluación detallada, categorizando los resultados como correctos, parcialmente correctos (aceptables o no) o incorrectos. Este proceso midió cómo el enfoque híbrido GraphRAG superó la línea de base, particularmente en el manejo de consultas multidimensionales que requerían combinar relaciones estructuradas con amplitud semántica. Al utilizar las fortalezas de la recuperación basada en vectores y gráficos, el sistema de Lettria demostró su capacidad para navegar las demandas matizadas de diversas industrias con precisión y flexibilidad.
Los resultados de la evaluación comparativa
Los resultados fueron significativos y convincentes. GraphRAG logró un 80% de respuestas correctas, en comparación con el 50,83% del RAG tradicional. Al incluir respuestas aceptables, la precisión de GraphRAG aumentó a casi el 90%, mientras que el enfoque vectorial alcanzó el 67,5%.
El siguiente gráfico muestra los resultados para el vector RAG y GraphRAG.
En el sector industrial, que se ocupa de especificaciones técnicas complejas, GraphRAG proporcionó un 90,63 % de respuestas correctas, casi duplicando el 46,88 % de Vector RAG. Estas cifras resaltan cómo GraphRAG ofrece ventajas sustanciales sobre el enfoque de solo vectores, particularmente para clientes centrados en estructurar datos complejos.
La confiabilidad general de GraphRAG y el manejo superior de consultas complejas permiten a los clientes tomar decisiones más informadas con confianza. Al ofrecer respuestas hasta un 35 % más precisas, aumenta significativamente la eficiencia y reduce el tiempo dedicado a examinar datos no estructurados. Estos convincentes resultados demuestran que la incorporación de gráficos en el flujo de trabajo de RAG no solo mejora la precisión, sino que es esencial para abordar la complejidad de las preguntas del mundo real.
Uso de AWS y Lettria para aplicaciones RAG mejoradas
En esta sección, analizamos cómo puede utilizar AWS y Lettria para aplicaciones RAG mejoradas.
AWS: una base sólida para la IA generativa
AWS ofrece un conjunto completo de herramientas y servicios para crear e implementar aplicaciones de IA generativa. Con AWS, tiene acceso a infraestructura escalable y servicios avanzados como amazon Neptune, un servicio de base de datos de gráficos totalmente administrado. Neptune le permite modelar y navegar de manera eficiente por relaciones complejas dentro de sus datos, lo que lo convierte en una opción ideal para implementar sistemas RAG basados en gráficos.
La implementación de GraphRAG desde cero generalmente requiere un proceso similar al siguiente diagrama.
El proceso se puede dividir de la siguiente manera:
- Según la definición del dominio, el modelo de lenguaje grande (LLM) puede identificar las entidades y las relaciones contenidas en los datos no estructurados, que luego se almacenan en una base de datos gráfica como Neptune.
- En el momento de la consulta, la intención del usuario se convierte en una consulta gráfica eficiente basada en la definición del dominio para recuperar las entidades y relaciones relevantes.
- Luego, los resultados se utilizan para aumentar la indicación y generar una respuesta más precisa en comparación con el RAG estándar basado en vectores.
La implementación de dicho proceso requiere que los equipos desarrollen habilidades específicas en temas como modelado de gráficos, consultas de gráficos, ingeniería rápida o mantenimiento del flujo de trabajo LLM. AWS lanzó un código abierto Kit de herramientas GraphRAG para simplificarlo para los clientes que desean crear y personalizar sus flujos de trabajo GraphRAG. Se esperan iteraciones en el proceso de extracción y búsqueda de gráficos para mejorar la precisión.
Implementaciones administradas de GraphRAG
Hay dos soluciones para GraphRAG administrado con AWS: la solución de Lettria, que pronto estará disponible en AWS Marketplace, y el soporte GraphRAG integrado de amazon Bedrock con Neptune. Lettria proporciona una forma accesible de integrar GraphRAG en sus aplicaciones. Al combinar la experiencia de Lettria en procesamiento de lenguaje natural (NLP) y tecnología de gráficos con la infraestructura escalable y administrada de AWS, puede desarrollar soluciones RAG que brinden resultados más precisos y confiables.
Los siguientes son beneficios clave de Lettria en AWS:
- Integración sencilla – La solución de Lettria simplifica la ingesta y el procesamiento de conjuntos de datos complejos
- Precisión mejorada – Puede lograr hasta un 35% mejor rendimiento en tareas de respuesta a preguntas
- Escalabilidad – Puede utilizar servicios escalables de AWS para manejar volúmenes de datos crecientes y demandas de los usuarios.
- Flexibilidad – El enfoque híbrido combina los puntos fuertes de las representaciones vectoriales y gráficas.
Además de la solución de Lettria, amazon Bedrock introdujo el soporte administrado de GraphRAG el 4 de diciembre de 2024, integrándose directamente con Neptune. GraphRAG con Neptune está integrado en las bases de conocimiento de amazon Bedrock y ofrece una experiencia integrada sin configuración adicional ni cargos adicionales más allá de los servicios subyacentes. GraphRAG está disponible en las regiones de AWS donde están disponibles amazon Bedrock Knowledge Bases y amazon Neptune Analytics (consulte la lista actual de regiones admitidas). Para obtener más información, consulte Recuperar datos y generar respuestas de IA con las bases de conocimiento de amazon Bedrock.
Conclusión
La precisión de los datos es una preocupación crítica para las empresas que adoptan aplicaciones de IA generativa. Al incorporar gráficos en su flujo de trabajo RAG, puede mejorar significativamente la precisión de sus sistemas. Los gráficos proporcionan una representación de datos más rica y matizada, capturando la complejidad de las consultas humanas y preservando el contexto.
GraphRAG es una opción clave a considerar para las organizaciones que buscan desbloquear todo el potencial de sus datos. Con el poder combinado de AWS y Lettria, puede crear aplicaciones RAG avanzadas que ayuden a satisfacer las exigentes necesidades de las empresas actuales basadas en datos y lograr una mejora de hasta un 35 % en la precisión.
Explore cómo puede implementar GraphRAG en AWS en su aplicación de IA generativa:
Acerca de los autores
Denise Gosnell es gerente principal de productos de amazon Neptune y se enfoca en infraestructura de inteligencia artificial generativa y aplicaciones de datos gráficos que permiten soluciones escalables y de vanguardia en todos los sectores verticales de la industria.
Vivien de Saint Pern es un arquitecto de soluciones de inicio que trabaja con nuevas empresas de IA/ML en Francia, centrándose en cargas de trabajo de IA generativa.