What is 向量数据库?
一种专门优化的数据库,用于存储、索引和查询在相似性搜索和检索增强生成中使用的高维向量嵌入。
Definition
向量数据库是专门为高维向量嵌入设计的存储系统——即神经网络产生的数值表示,用于编码文本、图像、音频或其他数据的语义含义。与通过精确匹配或关键词重叠进行搜索的传统数据库不同,向量数据库执行近似最近邻(ANN)搜索,在高维空间中找到与查询向量最相似的向量。这实现了语义搜索:找到与查询在概念上相似的文档,即使它们没有共享精确的关键词。
随着检索增强生成(RAG)的兴起,向量数据库已成为现代 AI 技术栈的关键组件。在 RAG 系统中,文档被转换为向量嵌入并存储在向量数据库中。当用户提出问题时,问题也被嵌入,向量数据库高效地找到语义最相似的文档块——通常在毫秒内完成,即使跨越数百万个向量。
流行的向量数据库解决方案包括专门构建的系统,如 Pinecone、Weaviate、Qdrant、Milvus 和 Chroma,以及传统数据库的向量扩展,如 PostgreSQL 的 pgvector。每种方案在可扩展性、成本、自托管选项和功能丰富度之间提供不同的权衡。向量数据库的选择显著影响 RAG 系统性能,因为检索质量直接决定生成响应的质量。
Why It Matters
向量数据库是 RAG 应用的基础设施支柱,而 RAG 代表了最常见的企业 LLM 部署模式。没有高效的向量搜索,RAG 系统无法以交互使用所需的速度检索相关上下文——通过暴力扫描数百万个嵌入需要数秒而非毫秒。
除了 RAG,向量数据库还支持语义搜索、推荐系统、重复检测和异常检测。对于 AI 团队来说,选择和配置正确的向量数据库是影响其 AI 应用质量和成本的关键基础设施决策。自托管选项如 Qdrant 和 Milvus 对于需要将数据保留在本地的组织尤为重要。
How It Works
向量数据库使用近似最近邻(ANN)算法使高维相似性搜索变得可行。最常见的索引方法包括 HNSW(分层可导航小世界图),它构建连接相似向量的多层图;IVF(倒排文件索引),将向量分区为聚类并仅搜索附近的聚类;以及乘积量化,压缩向量以减少内存使用和搜索时间。
当查询向量到达时,索引结构快速将搜索空间从数百万个候选缩小到几千个,然后在这个缩减集上进行精确的距离计算。距离度量——通常是余弦相似度、点积或欧几里得距离——决定了相似性的定义方式。大多数向量数据库还支持混合搜索,将向量相似性与传统的基于关键词的过滤相结合,允许类似「查找最近 30 天内的相似文档」的查询。
Example Use Case
一个客户支持平台将 200 万篇知识库文章和常见问题解答嵌入到向量数据库中。当客户用自然语言描述他们的问题时,系统嵌入描述并在 50 毫秒内检索到 5 篇语义最相似的知识库文章。这些文章被传递给 LLM 生成量身定制的回复,与基于关键词的搜索相比,转给人工客服的工单减少了 40%。
Key Takeaways
- 向量数据库存储和搜索高维嵌入以实现语义相似性检索。
- 它们是 RAG 系统和语义搜索应用的基础设施。
- HNSW 和 IVF 等 ANN 算法实现跨数百万向量的毫秒级搜索。
- 既有专门构建的(Pinecone、Qdrant)也有基于扩展的(pgvector)选项。
- 向量数据库的检索质量直接决定 RAG 响应质量。
How Ertas Helps
Ertas Data Suite 可以将处理和分块后的文档导出为可直接导入向量数据库的格式,简化了从原始文档到可搜索嵌入的管道,为由 Ertas Studio 微调的模型驱动的 RAG 系统提供支持。
Related Resources
Ship AI that runs on your users' devices.
Early bird pricing starts at $14.50/mo — locked in for life. Plans for builders and agencies.