Elastic 和 NVIDIA 可帮助您更快部署 AI 应用,避免过度消耗 IT 基础设施

消除瓶颈、智能扩展、控制成本。借助 Elastic 和 NVIDIA 的支持,您可利用 GPU 加速向量数据库的强大功能,实现高性能 AI。

Video thumbnail

通过 GPU 加速的向量搜索提升 AI 性能

Elasticsearch 与 NVIDIA 合作,将 GPU 支持引入您的搜索堆栈。通过利用 cuVS 库和 CAGRA 算法,Elasticsearch 已经解锁了大规模并行处理,为需求最苛刻的检索增强生成 (RAG) 管道和 AI 应用程序提供快速和超低延迟索引。

使用 GPU 进行索引可以获得最大吞吐量。在 CPU 上搜索可以实现成本效益。性能和价格可以同时得到优化。

数据说明一切

  • 12
    提升索引吞吐量
  • 7
    减少合并延迟
  • 5
    成本调整后的吞吐量与仅 CPU 吞吐量的比较

Elasticsearch 向量数据库与 NVIDIA cuVS:强强联合

  • 加速发展您的 AI 工厂

    通过预先设计的蓝图,更快地启动高性能搜索和智能体 AI。Elasticsearch 是 NVIDIA 企业 AI 工厂验证设计中推荐的向量数据库,提供一个可靠的本地部署框架以实现扩展。

  • 大幅提升索引速度

    您可以大规模索引数据,无需担心瓶颈。集成 NVIDIA cuVS 后,索引吞吐量可最多提升 12 倍,强制合并速度可加快 7 倍,让您能够以前所未有的效率处理海量数据。

  • 请最大化基础设施的价值

    将数学密集型索引转移到 GPU,可以减轻 CPU 压力并回收资源。经成本调整后,GPU 加速可提供 5 倍的吞吐量和 6 倍的强制合并速度,从而在现有硬件预算中为您提供卓越的性能。

  • 提高查询性能

    您可以用近乎瞬时的响应时间处理海量查询。Elastic 的 NVIDIA 加速搜索可确保您的基础架构能够与下一代 GenAI 并行扩展,从而提供复杂智能体工作流所需的高速检索。

面向企业

结合 Elastic 和 NVIDIA 的优势,为您优化

  • 开放且适合企业使用

    在开源创新的基础上放心构建。GPU 加速由 Apache 2.0 授权的 NVIDIA cuVS 库提供支持,并通过 ELv2 授权插件集成到 Elasticsearch 中,将开放灵活性与企业级支持相结合。

  • 无限索引扩展

    您可以大规模索引数据,无需担心瓶颈。集成 NVIDIA cuVS 后,索引吞吐量可提升 12 倍,强制合并速度可加快 7 倍,让您能够以前所未有的效率处理海量数据。

  • 借助 Kubernetes 实现 Elastic 扩展

    扩展加速就像扩展集群一样简单。通过 Kubernetes 编排将 Elasticsearch 进程映射到单个 GPU,您可以在多个服务器之间分发大型索引工作负载,以实现最大的并行吞吐量。

  • CPU 与 GPU 无缝协同

    您可以同时获得 CPU 与 GPU 的优势。Elastic 利用 GPU 发挥最佳功能——图表构建的批量运算——同时将搜索保留在 CPU 上。这可确保您的高性能 HNSW 图表以创纪录的速度构建,同时仍可通过标准方式进行检索。

常见问题

Elasticsearch 的 GPU 加速向量索引功能是否已开源?

是的,实现 GPU 加速向量索引的代码是开源的(双重许可:AGPL 和 ELv2)。Elasticsearch 通过一个插件公开 GPU 加速向量索引功能,该插件在 ELv2 许可下发布,并在企业订阅层级提供。为 Elasticsearch 提供 GPU 索引功能的 NVIDIA cuVS 库也是开源的,采用 Apache 2.0 许可。