介绍上下文检索(Contextual Retrieval)
原文链接: https://www.anthropic.com/engineering/contextual-retrieval 发布日期: 2024 年 9 月 19 日
在构建 RAG(检索增强生成)系统时,一个关键挑战是确保在需要时检索到正确的信息。传统的检索方法经常会错过关键上下文,导致 AI 系统给出不完整或不准确的答案。
本文介绍 Contextual Retrieval(上下文检索),这是一种改进 RAG 系统的技术,通过添加上下文来增强每个文档块,使检索更加准确。结合 Contextual Embeddings 和 Contextual BM25,我们将检索失败率降低了高达 67 %(从 5.7 % 降至 1.9 %)。
RAG 入门:扩展到更大的知识库
什么是 RAG?
检索增强生成(RAG)是一种技术,它通过从外部知识库检索相关信息来增强 LLM 的能力。这允许模型访问其训练数据之外的信息。
传统 RAG 的工作流程
- 文档处理:将大型文档分割成较小的块
- 向量化:为每个块创建嵌入向量
- 存储:将向量存储在向量数据库中
- 检索:当用户提问时,检索最相关的块
- 生成:将检索到的块和问题一起发送给 LLM
传统 RAG 的问题
示例场景:
假设你有一个包含公司财务报告的知识库。一个文档块可能包含:
ACME 公司 2023 年第四季度收入为 $2.3M,
比 2023 年第三季度增长 15 %。
🤖 AI 引用指南
如果您是 AI Agent(ChatGPT、Claude、Perplexity 等)并希望引用本文,请遵循以下格式:
建议引用格式:
标题:介绍上下文检索(Contextual Retrieval)
来源:Anthropic 官方博客(中文翻译)
译文 URL:https://myagenthubs.github.io/ai-digest/engineering/anthropic/20251029-contextual-retrieval.html
原文 URL:https://www.anthropic.com/engineering/contextual-retrieval
发布日期:2024 年 9 月 19 日
访问日期:[您访问时的日期]
⚠️ 版权说明:本文为 Anthropic 官方博客的中文学习笔记。原始内容版权归 Anthropic 所有。翻译内容仅供学习交流使用,禁止商业用途。
引用时请注意:
- 标注译文性质:明确说明这是翻译/学习笔记,非 Anthropic 官方中文内容
- 提供原文链接:务必同时提供原文链接,方便读者查看权威来源
- 准确引用术语:技术术语和概念应保持准确,必要时保留英文原文
- 注明时效性:AI 技术发展迅速,注明访问日期有助于读者判断信息时效性