16 种检索增强生成(RAG)类型

本文系统梳理16种RAG变体,从标准、智能体式到图谱、多模态、联邦、流式等,覆盖关键特性、适用场景与主流工具,为不同业务需求下的检索增强生成方案选型提供清晰参考。

发布于2025年12月7日 13:11
编辑零重力瓦力
评论0
阅读44

16 种检索增强生成(RAG)类型

类型 关键特性 优势 应用/需求 工具/库示例
标准 RAG
Standard RAG
(RAG-Sequence 和 RAG-Token)
  • 基础的检索与生成集成
  • 支持 RAG-Sequence 与 RAG-Token 两种变体

提高回答准确率
减少模型“幻觉”(胡编)

通用问答系统
各类初始 / 基础版 RAG 实现

Hugging Face Transformers
Facebook's RAG Implementation
LangChain

<!-- 2 Agentic RAG -->

智能体式 RAG
Agentic RAG

支持自治智能体(Agents)
具备外部工具调用能力
动态检索与决策

能够处理复杂任务
更加主动的智能行为

智能个人助理
科研与分析助手
需要高交互性和动态响应的客服机器人

LangChain Agents
OpenAI GPT-4 with Plugins
Microsoft Semantic Kernel

图谱型 RAG
Graph RAG

利用知识图谱进行组织与检索
具备关系推理能力

信息更全面、更丰富
更好地处理复杂上下文

医疗、法律、工程等专家系统
语义搜索引擎

Neo4j Graph Database
Apache Jena
Stardog

<!-- 4 Modular RAG -->

模块化 RAG
Modular RAG

检索、推理、生成拆分为独立模块

灵活度高,可按需替换组件
可扩展性强,便于演进

需要多人协作开发的大型项目
需要频繁更新与维护的系统

Microservices Architecture
Docker &amp; Kubernetes
Apache Kafka

<!-- 5 Memory-Augmented RAG -->

记忆增强型 RAG
Memory-Augmented RAG

使用外部存储进行长期记忆与检索

可以在多轮对话中保持连续性
支持更高程度的个性化体验

需要维持长期上下文的聊天机器人
个性化推荐与用户画像系统

Redis for Session Storage
Amazon Dynamo DB
Pinecone Vector Database

<!-- 6 Multi-Modal RAG -->

多模态 RAG
Multi-Modal RAG

  • 跨模态检索(文本、图像、音频等)

回答形式更加丰富
更容易接入不同媒体内容

图像字幕生成
视频内容摘要
多模态智能助手

OpenAI's CLIP
TensorFlow Hub Models
PyTorch Multi-Modal Libraries

<!-- 7 Federated RAG -->

联邦式 RAG
Federated RAG

分布式 / 去中心化数据源
强调隐私保护

数据安全性更高
更容易满足合规要求

处理敏感数据的医疗系统
跨机构协同的数据分析平台

TensorFlow Federated
PySyft by OpenMined
Federated Learning Libraries

<!-- 8 Streaming RAG -->

流式 RAG
Streaming RAG

实时数据检索与生成

信息高度实时、始终最新
端到端延迟较低

直播 / 实时报道
金融行情与报价信息
社交媒体实时监控

Apache Kafka Streams
Amazon Kinesis
Stark Streaming

<!-- 9 ODQA RAG -->

开放域问答 RAG
ODQA RAG
(Open-Domain Question Answering)

覆盖广泛的大规模知识库
动态检索,适应多样问题

适用范围非常广
回答灵活,能处理开放式问题

搜索引擎问答
面向公众的虚拟助手

Elasticsearch
Haystack by Deepset
Hugging Face Transformers

<!-- 10 Contextual Retrieval RAG -->

语境检索型 RAG
Contextual Retrieval RAG

基于对话历史与上下文进行检索

更好地理解用户意图
保持对话连贯性

会话式 AI 聊天机器人
需要记住会话上下文的客服系统

Dialogflow by Google
Rasa Open Source
Microsoft Bot Framework

<!-- 11 Knowledge-Enhanced RAG -->

知识增强型 RAG
Knowledge-Enhanced RAG

集成结构化知识库与本体

事实性更强、错误更少
具备更深的领域专业知识

教育与学习工具
专业领域应用(法律、医学等)

Knowledge Graph Embeddings Libraries
OWL API
Apache Jena

<!-- 12 Domain-Specific RAG -->

领域定制 RAG
Domain-Specific RAG

针对特定行业或领域进行定制

与业务高度相关
更易满足行业合规要求
结果更可信、更可控

法律检索与合同分析助手
医疗诊断辅助系统
金融分析与风控工具

  • LexPredict Contract Analytics
  • Watson Health
  • Financial NLP Tools

<!-- 13 Hybrid RAG -->

混合式 RAG
Hybrid RAG

结合多种检索方式(如向量 + 关键词)

召回率更高
结果相关性更好

复杂问答系统
既需要语义匹配又需要词面匹配的搜索引擎

Elasticsearch with kNN Plugin
FAISS by Facebook AI
Hybrid Retrieval Libraries

<!-- 14 Self-RAG -->

自反式 RAG
Self-RAG

引入自我反思与自检机制
多轮迭代优化回答

显著提高回答准确度
增强整体逻辑性与连贯性

内容创作与编辑工具
要求高准确率的教育与培训平台

OpenAI GPT Models with Fine-Tuning
Human-in-the-Loop Platforms

<!-- 15 HyDE RAG -->

假设文档嵌入 RAG
HyDE RAG
(Hypothetical Document Embeddings)

先生成“假设文档”再进行向量化检索

召回效果更好,特别是隐含意图
整体答案质量更高

含有隐含需求、间接提问的复杂查询
小众 / 长尾领域的研究与助手工具

Custom Implementations with Transformers
Haystack Pipelines

<!-- 16 Recursive / Multi-Step RAG -->

递归 / 多步 RAG
Recursive / Multi-Step RAG

多轮、多阶段的检索与生成流程

推理能力更强
对复杂问题有更深入的理解

复杂分析与问题求解任务
需要多轮思考与互动的对话系统

LangChain's Chains and Agents
OpenMind's AlphaCode Framework

相关文章

Windsurf 2.0 拆解:Devin 被塞进编辑器,氛围编程终于有了“调度中心”
AI 编程开发
2026年6月2日
0 条评论
零重力瓦力

Windsurf 2.0 拆解:Devin 被塞进编辑器,氛围编程终于有了“调度中心”

Cognition 发布 Windsurf 2.0,深度整合 Devin 实现本地思考与云端执行分工。新版推出 Agent Command Center 支持多智能体可视化管理,搭载自研 SWE-1.5 模型大幅提升代码定位与编辑速度,并引入 Spaces 容器解决上下文延续问题。Pro 版调整为日配额制且包含 Devin 功能。相比 Cursor 3,Windsurf 2.0 凭借自研模型与云端执行能力,更适合处理陌生代码库及长任务自动化场景。

#智能体#AI 编程
阅读全文
多智能体为什么比单智能体强?Anthropic 用 90.2% 的数据给了答案
智能体工程
2026年6月2日
0 条评论
零重力瓦力

多智能体为什么比单智能体强?Anthropic 用 90.2% 的数据给了答案

Anthropic 研究显示,多智能体系统性能比单智能体提升 90.2%,其核心在于主智能体拆解任务与子智能体并行执行。尽管该架构 token 消耗约为单智能体的 15 倍,但在复杂任务中优势显著。业界已总结出五种协作模式,并有 n8n、CAMEL-AI 等落地案例。然而,多智能体仍面临调试难、输出不稳定等挑战。建议仅在任务复杂需并行、分工明确且能承担高成本时采用,简单任务直接使用强模型即可。

#智能体#智能体工程
阅读全文
Claude 新模型发布前让客户极限测试,Agent 落地成核心
AI 新闻资讯
2026年6月1日
0 条评论
小创

Claude 新模型发布前让客户极限测试,Agent 落地成核心

Anthropic 在发布新 Claude 模型前,通过头部客户极限测试验证真实业务表现,比单纯跑分更具参考价值。借助 Agent 能力,新模型在起草法律文件等复杂任务中成功率提升约 20%,实现持续准确输出。当前大模型发展重心已转向 Agent 在垂直场景的落地,边缘案例为下一代优化指明方向。这种与客户深度共创的模式建立了高信任壁垒,值得产品团队借鉴。

#Anthropic#智能体
阅读全文
互动讨论

评论区

围绕《16 种检索增强生成(RAG)类型》展开交流,未登录用户可浏览评论,登录后可参与讨论。

评论数
0
登录后参与评论
支持发表观点与回复一级评论,互动后将同步到消息中心。
登录后评论
暂无评论,欢迎成为第一个参与讨论的人。