IA generativa con Amazon Neptune

Análisis de grafos de alto rendimiento y base de datos sin servidor para una escalabilidad y disponibilidad superiores

Información general

A medida que las organizaciones crean e implementan aplicaciones de inteligencia artificial (IA) generativa, aumentan sus expectativas de precisión, exhaustividad y explicabilidad. Proporcionar un contexto empresarial y específico del dominio mediante técnicas como la generación aumentada por recuperación (RAG) puede ayudar hasta cierto punto: la RAG es rentable para proporcionar información actual y pertinente para la IA generativa, al tiempo que mantiene la gobernanza y el control de los datos.

La generación aumentada de recuperación de gráficos (GraphRAG) lleva la RAG al siguiente nivel al aprovechar la potencia tanto del análisis de gráficos como de la búsqueda vectorial para mejorar la precisión, la exhaustividad y la explicabilidad de las respuestas de la IA. GraphRAG lo consigue al aprovechar las relaciones entre entidades o elementos estructurales de los datos, como secciones o títulos con fragmentos de documentos, para proporcionar los datos más pertinentes como entrada a las aplicaciones RAG. Mediante el uso de gráficos de conocimiento, las aplicaciones RAG pueden recuperar conexiones de varios saltos entre entidades o temas relacionados y utilizar estos hechos para aumentar una respuesta generativa.

IA generativa con Amazon Neptune

Amazon proporciona rutas totalmente administradas y autoadministradas para crear y ejecutar aplicaciones GraphRAG.

  • Totalmente administradas: las bases de conocimiento de Amazon Bedrock ofrece el primer servicio GraphRAG totalmente administrado del mundo con Amazon Neptune. Administran automáticamente la creación y el mantenimiento de gráficos e incrustaciones, lo que permite a los clientes ofrecer respuestas más pertinentes a los usuarios finales. Al ser un servicio totalmente administrado, se evitan los retos de establecer las configuraciones e integrarse con otros LLM o bases de datos vectoriales. 
  • Autogestionadas: para usuarios que buscan autoalojamiento o flexibilidad para conectarse a orígenes de datos personalizados, integraciones con productos de terceros (modelos fundacionales, almacenes de vectores, almacenes de datos) y autoalojamiento de su pila de aplicaciones de IA generativa.
    • Kit de herramientas AWS GraphRAG Python: AWS ha publicado el kit de herramientas de código abierto GraphRAG , que es compatible con modelos fundacionales y de gráficos actualizados. Proporciona un marco para automatizar la creación de un gráfico a partir de datos no estructurados y para consultar este gráfico a la hora de responder a las preguntas de los usuarios.
    • Marcos de trabajo de código abierto: AWS es compatible con proyectos de código abierto populares, como LangChain y LlamaIndex, y contribuye a ellos para crear canalizaciones RAG de producción.

Los usuarios que no estén familiarizados con los lenguajes de consulta para bases de datos de grafos pueden utilizar la integración de Neptune con LangChain. Esto le permite consultar su base de datos de gráficos de Neptune utilizando lenguaje natural. Por ejemplo, puede usar la NeptuneOpenCypherQAChain para traducir preguntas en inglés a consultas de openCypher y devolver una respuesta legible para personas humanas. Esta cadena se puede utilizar para responder a preguntas como “¿Qué aeropuerto estadounidense tiene las rutas de salida más largas y más cortas?”

LangChain es un marco de código abierto de Python diseñado para simplificar la creación de aplicaciones con modelos de lenguaje de gran tamaño (LLM). Gracias a la integración de Neptune en LangChain, los desarrolladores utilizan el marco de código abierto de LangChain para simplificar la creación de aplicaciones sensibles al contexto.

Con Neptune y LangChain, puede devolver una respuesta basada en el contexto proporcionado y consultar una base de datos de grafos de Neptune mediante el lenguaje de consultas openCypher. Por ejemplo, puede usar la cadena de control de calidad de openCypher de Neptune para traducir preguntas en inglés a consultas de openCypher y devolver una respuesta legible para personas humanas. Esta cadena se puede usar para responder preguntas como “¿Cuántas rutas de salida tiene el aeropuerto de Austin?”

Para obtener más información sobre la cadena de control de calidad openCypher de Neptune, consulte la documentación de LangChain de código abierto.

LlamaIndex es un marco de datos de código abierto para conectar orígenes de datos personalizados a modelos de lenguaje grandes (LLM) y admite el uso de gráficos de conocimiento con LLM.

Con LlamaIndex, puede usar Neptune como almacén de gráficos o almacén vectorial para crear aplicaciones de IA generativa con técnicas como GraphRAG.

Casos de uso

GraphRAG se puede utilizar para mejorar el servicio de asistencia de TI y el centro de contacto. Por ejemplo, GraphRAG puede permitir a los equipos del centro de operaciones de seguridad (SOC) interpretar las alertas con mayor precisión para ayudar a proteger los sistemas críticos. Un chatbot de asistencia sanitaria puede encontrar rápidamente información pertinente en grandes volúmenes de literatura médica para responder a preguntas complejas sobre síntomas, tratamientos y resultados de los pacientes.

Las aplicaciones GraphRAG pueden proporcionar información detallada a equipos de funciones corporativas como planificación financiera y contabilidad (FP&A), marketing, jurídico, recursos humanos, etc. Por ejemplo, los equipos jurídicos de las empresas pueden encontrar más eficazmente información sobre leyes fiscales, reglamentos y precedentes judiciales para idear estrategias de casos. Los equipos de marketing pueden crear vistas integrales del cliente basadas en las conexiones sociales y el historial de compras de un posible cliente.

Empresas de todos los sectores se benefician de GraphRAG. Por ejemplo, en la industria farmacéutica, los equipos de Investigación y desarrollo pueden utilizar GraphRAG para acelerar la investigación y los ensayos de medicamentos. En el ámbito de la banca de inversión, la capacidad de GraphRAG para trazar relaciones complejas y ofrecer una visión holística de los expedientes de las empresas ayuda a los equipos de diligencia debida a descubrir información, como los derechos normativos y la dinámica de la competencia, que de otro modo no resultaría evidente.

Las recomendaciones tradicionales utilizan los servicios de análisis de forma manual para recomendar productos. Neptune ML identifica directamente nuevas relaciones en los datos de los gráficos y recomienda, de manera sencilla, una lista de juegos que al jugador le interesaría comprar, otros jugadores a los que le interesaría seguir, o productos que le gustaría adquirir.

Precios

No se necesitan inversiones iniciales. Solo paga por los recursos de AWS utilizados, como Amazon SageMaker, Neptune y Amazon Simple Storage Service (Amazon S3).

Introducción

Hay muchas maneras de comenzar, entre ellas: