Elastic 和 NVIDIA 可帮助您更快部署 AI 应用，避免过度消耗 IT 基础设施

消除瓶颈、智能扩展、控制成本。借助 Elastic 和 NVIDIA 的支持，您可利用 GPU 加速向量数据库的强大功能，实现高性能 AI。

深入了解

通过 GPU 加速的向量搜索提升 AI 性能

Elasticsearch 与 NVIDIA 合作，将 GPU 支持引入您的搜索堆栈。通过利用 cuVS 库和 CAGRA 算法，Elasticsearch 已经解锁了大规模并行处理，为需求最苛刻的检索增强生成 (RAG) 管道和 AI 应用程序提供快速和超低延迟索引。

使用 GPU 进行索引可以获得最大吞吐量。在 CPU 上搜索可以实现成本效益。性能和价格可以同时得到优化。

数据说明一切

12倍
提升索引吞吐量
7倍
减少合并延迟
5倍
成本调整后的吞吐量与仅 CPU 吞吐量的比较

Elasticsearch 向量数据库与 NVIDIA cuVS：强强联合

加速发展您的 AI 工厂
通过预先设计的蓝图，更快地启动高性能搜索和智能体 AI。Elasticsearch 是 NVIDIA 企业 AI 工厂验证设计中推荐的向量数据库，提供一个可靠的本地部署框架以实现扩展。
大幅提升索引速度
您可以大规模索引数据，无需担心瓶颈。集成 NVIDIA cuVS 后，索引吞吐量可最多提升 12 倍，强制合并速度可加快 7 倍，让您能够以前所未有的效率处理海量数据。
请最大化基础设施的价值
将数学密集型索引转移到 GPU，可以减轻 CPU 压力并回收资源。经成本调整后，GPU 加速可提供 5 倍的吞吐量和 6 倍的强制合并速度，从而在现有硬件预算中为您提供卓越的性能。
提高查询性能
您可以用近乎瞬时的响应时间处理海量查询。Elastic 的 NVIDIA 加速搜索可确保您的基础架构能够与下一代 GenAI 并行扩展，从而提供复杂智能体工作流所需的高速检索。

面向企业

结合 Elastic 和 NVIDIA 的优势，为您优化

开放且适合企业使用
在开源创新的基础上放心构建。GPU 加速由 Apache 2.0 授权的 NVIDIA cuVS 库提供支持，并通过 ELv2 授权插件集成到 Elasticsearch 中，将开放灵活性与企业级支持相结合。
无限索引扩展
您可以大规模索引数据，无需担心瓶颈。集成 NVIDIA cuVS 后，索引吞吐量可提升 12 倍，强制合并速度可加快 7 倍，让您能够以前所未有的效率处理海量数据。
借助 Kubernetes 实现 Elastic 扩展
扩展加速就像扩展集群一样简单。通过 Kubernetes 编排将 Elasticsearch 进程映射到单个 GPU，您可以在多个服务器之间分发大型索引工作负载，以实现最大的并行吞吐量。
CPU 与 GPU 无缝协同
您可以同时获得 CPU 与 GPU 的优势。Elastic 利用 GPU 发挥最佳功能——图表构建的批量运算——同时将搜索保留在 CPU 上。这可确保您的高性能 HNSW 图表以创纪录的速度构建，同时仍可通过标准方式进行检索。

常见问题

Elasticsearch 的 GPU 加速向量索引功能是否已开源？

是的，实现 GPU 加速向量索引的代码是开源的（双重许可：AGPL 和 ELv2）。Elasticsearch 通过一个插件公开 GPU 加速向量索引功能，该插件在 ELv2 许可下发布，并在企业订阅层级提供。为 Elasticsearch 提供 GPU 索引功能的 NVIDIA cuVS 库也是开源的，采用 Apache 2.0 许可。

Elastic 和 NVIDIA 可帮助您更快部署 AI 应用，避免过度消耗 IT 基础设施

深入了解

探索 Elasticsearch 中的 NVIDIA 合作版 GPU 加速向量搜索

使用 NVIDIA GPU 使向量索引速度提高 12 倍

大规模向量搜索：使用 GPU 支持 Lucene

通过 GPU 加速的向量搜索提升 AI 性能

数据说明一切

Elasticsearch 向量数据库与 NVIDIA cuVS：强强联合

加速发展您的 AI 工厂

大幅提升索引速度

请最大化基础设施的价值

提高查询性能

面向企业

结合 Elastic 和 NVIDIA 的优势，为您优化

开放且适合企业使用

无限索引扩展

借助 Kubernetes 实现 Elastic 扩展

CPU 与 GPU 无缝协同

常见问题

Elasticsearch 的 GPU 加速向量索引功能是否已开源？

如果遇到问题或想要提出建议，应该怎么做？

如何在 Elasticsearch 数据节点上安装 NVIDIA cuVS 以启用 GPU 向量索引？

向量索引能否跨一台或多台服务器上的多个 GPU 进行扩展？

向量索引大小是否受可用 GPU 内存的限制？

向量搜索是否可以使用 GPU 加速？

如何评估 GPU 向量索引的性能和成本效益？

支持哪些元素和索引类型？

关注我们

关于我们

加入我们

合作伙伴

信任和安全性

投资者关系

卓越奖

关于我们

加入我们

合作伙伴

信任和安全性

投资者关系

卓越奖