What is 向量数据库?

一种专门优化的数据库，用于存储、索引和查询在相似性搜索和检索增强生成中使用的高维向量嵌入。

Definition

向量数据库是专门为高维向量嵌入设计的存储系统——即神经网络产生的数值表示，用于编码文本、图像、音频或其他数据的语义含义。与通过精确匹配或关键词重叠进行搜索的传统数据库不同，向量数据库执行近似最近邻（ANN）搜索，在高维空间中找到与查询向量最相似的向量。这实现了语义搜索：找到与查询在概念上相似的文档，即使它们没有共享精确的关键词。

随着检索增强生成（RAG）的兴起，向量数据库已成为现代 AI 技术栈的关键组件。在 RAG 系统中，文档被转换为向量嵌入并存储在向量数据库中。当用户提出问题时，问题也被嵌入，向量数据库高效地找到语义最相似的文档块——通常在毫秒内完成，即使跨越数百万个向量。

流行的向量数据库解决方案包括专门构建的系统，如 Pinecone、Weaviate、Qdrant、Milvus 和 Chroma，以及传统数据库的向量扩展，如 PostgreSQL 的 pgvector。每种方案在可扩展性、成本、自托管选项和功能丰富度之间提供不同的权衡。向量数据库的选择显著影响 RAG 系统性能，因为检索质量直接决定生成响应的质量。

Why It Matters

向量数据库是 RAG 应用的基础设施支柱，而 RAG 代表了最常见的企业 LLM 部署模式。没有高效的向量搜索，RAG 系统无法以交互使用所需的速度检索相关上下文——通过暴力扫描数百万个嵌入需要数秒而非毫秒。

除了 RAG，向量数据库还支持语义搜索、推荐系统、重复检测和异常检测。对于 AI 团队来说，选择和配置正确的向量数据库是影响其 AI 应用质量和成本的关键基础设施决策。自托管选项如 Qdrant 和 Milvus 对于需要将数据保留在本地的组织尤为重要。

How It Works

向量数据库使用近似最近邻（ANN）算法使高维相似性搜索变得可行。最常见的索引方法包括 HNSW（分层可导航小世界图），它构建连接相似向量的多层图；IVF（倒排文件索引），将向量分区为聚类并仅搜索附近的聚类；以及乘积量化，压缩向量以减少内存使用和搜索时间。

当查询向量到达时，索引结构快速将搜索空间从数百万个候选缩小到几千个，然后在这个缩减集上进行精确的距离计算。距离度量——通常是余弦相似度、点积或欧几里得距离——决定了相似性的定义方式。大多数向量数据库还支持混合搜索，将向量相似性与传统的基于关键词的过滤相结合，允许类似「查找最近 30 天内的相似文档」的查询。