Generación aumentada de recuperación: un problema de búsqueda
Search es una infraestructura crítica para trabajar con modelos de lenguaje grande (LLM) y construir las mejores experiencias de AI generativa. Tienes una sola oportunidad para indicarle a un LLM que genere la respuesta correcta con tus datos, por lo que la relevancia es fundamental. Haz que tus LLM despeguen con generación aumentada de recuperación (RAG) y Elastic.

Prueba este aprendizaje práctico a tu propio ritmo para aprender a construir una aplicación RAG
Prueba el aprendizaje prácticoIncorpora RAG en tus aplicaciones y prueba diferentes LLM con una base de datos vectorial
Descubre más en los laboratorios de ElasticsearchDescubre cómo crear aplicaciones avanzadas basadas en RAG con Elasticsearch Relevance Engine™
Mira el video de inicio rápidoCUENTA CON LA CONFIANZA DE LAS EMPRESAS FORTUNE 500 PARA IMPULSAR LA INNOVACIÓN DE LA AI GENERATIVA




Prepara tus datos para RAG
RAG amplía el poder de los LLM al acceder a datos propietarios relevantes sin necesidad de volver a entrenarlos. Al usar RAG con Elastic, te beneficias de:
- Técnicas de búsqueda de vanguardia
- Selección fácil de modelos y la capacidad de intercambiar modelos sin esfuerzo.
- Acceso seguro a documentos y basado en roles para garantizar que tus datos se mantengan protegidos.

Transforma las experiencias de búsqueda
¿Qué es la generación aumentada de recuperación?
La generación aumentada de recuperación (RAG) es un patrón que mejora la generación de texto al integrar información relevante de fuentes de datos privados. Al proporcionar un contexto específico del dominio al modelo generativo, RAG mejora la precisión y la relevancia de las respuestas de texto generadas.
Usa Elasticsearch para ventanas de contexto de alta relevancia que aprovechen tus datos privados para mejorar la salida de los LLM y entregar la información en una experiencia conversacional segura y eficiente.

CÓMO FUNCIONA RAG CON ELASTIC
Mejora tus flujos de trabajo de RAG con Elasticsearch
Descubre cómo usar Elastic para flujos de trabajo de RAG mejora las experiencias de AI generativa. Sincroniza fácilmente con la información en tiempo real mediante fuentes de datos privados para obtener las mejores respuestas de AI generativa más relevantes.
El pipeline de inferencia de machine learning utiliza procesadores de ingesta de Elasticsearch para extraer incrustaciones de manera eficiente. Combinando sin problemas la búsqueda por coincidencia de texto (BM25) y la búsqueda vectorial (kNN), recupera los documentos con las mejores puntuaciones para generar respuestas contextualizadas.

CASO DE USO
Servicio de preguntas y respuestas que funciona con tu conjunto de datos privados
Implementa experiencias de preguntas y respuestas usando RAG, con tecnología de Elasticsearch como base de datos vectorial.

Elasticsearch: la base de datos vectorial más ampliamente desplegada
Copia para probar localmente en dos minutos
curl -fsSL https://elastic.co/start-local | sh
Búsqueda de IA — en acción
Cliente destacado
Consensus actualiza la plataforma de investigación académica con búsqueda semántica avanzada y herramientas de AI de Elastic.
Cliente destacado
Cisco crea experiencias de búsqueda impulsadas por AI con Elastic en Google Cloud.
Cliente destacado
Georgia State University aumenta la información sobre los datos y analiza cómo ayudar a los estudiantes a solicitar asistencia financiera mediante la búsqueda impulsada por AI.
Preguntas frecuentes
La generación aumentada de recuperación (comúnmente conocida como RAG) es un patrón de procesamiento del lenguaje natural que permite a las empresas buscar en fuentes de datos privados y proporcionar un contexto que sustente grandes modelos de lenguaje. Esto permite respuestas más precisas y en tiempo real en aplicaciones de AI generativa.
Cuando se implementa de manera óptima, RAG proporciona acceso seguro a datos privados relevantes y específicos del dominio en tiempo real. Puede reducir la incidencia de alucinaciones en aplicaciones de AI generativa y aumentar la precisión de las respuestas.
RAG es una técnica compleja que se basa en lo siguiente:
- La calidad de los datos que se introducen.
- La eficacia de la recuperación de búsqueda.
- La seguridad de los datos.
- La capacidad de citar las fuentes de las respuestas de AI generativa para ajustar los resultados.
Además, elegir la AI generativa o el modelo de lenguaje grande (LLM) correcto en un ecosistema en rápida evolución puede presentar desafíos para las organizaciones. Y los costos, el rendimiento y la escalabilidad asociados con RAG pueden ralentizar la velocidad a la que las empresas lanzan aplicaciones a producción.
Elasticsearch es una plataforma de AI flexible y una base de datos vectorial que puede indexar y almacenar datos estructurados y no estructurados de cualquier fuente. Ofrece una recuperación de información eficiente y personalizable y una vectorización automática en miles de millones de documentos. Y ofrece seguridad empresarial con control de acceso a nivel de roles y documentos. Elastic también ofrece una interfaz estándar para acceder a innovaciones en un ecosistema de GenAI en expansión, que incluye hiperescaladores, repositorios de modelos y marcos de trabajo. Finalmente, Elastic ha demostrado su eficacia en entornos a escala de producción y presta servicio a más del 50 % de las empresas Fortune 500. Explora cómo construir sistemas RAG en Elastic con Playground.
Elastic proporciona búsqueda entre clusters (CCS) y réplica entre clusters (CCR) para ayudarte a gestionar y proteger datos en entornos privados, locales y en el cloud. Con CCS y CCR, puedes hacer lo siguiente:
- Garantizar una alta disponibilidad.
- Mantén el cumplimiento con las normativas globales de protección de datos
- Lograr la privacidad y soberanía de tus datos.
- Crea una estrategia eficaz de recuperación ante desastres
Elastic también ofrece control de acceso basado en roles y a nivel de documento que autoriza a los clientes y empleados a recibir solo respuestas con los datos a los que tienen acceso. Y nuestros usuarios pueden obtener información valiosa de una observabilidad y un monitoreo integrales para cualquier despliegue.