16 种检索增强生成(RAG)类型

本文系统梳理16种RAG变体,从标准、智能体式到图谱、多模态、联邦、流式等,覆盖关键特性、适用场景与主流工具,为不同业务需求下的检索增强生成方案选型提供清晰参考。

发布于2025年12月7日 13:11
编辑零重力瓦力
评论0
阅读52

16 种检索增强生成(RAG)类型

类型 关键特性 优势 应用/需求 工具/库示例
标准 RAG
Standard RAG
(RAG-Sequence 和 RAG-Token)
  • 基础的检索与生成集成
  • 支持 RAG-Sequence 与 RAG-Token 两种变体

提高回答准确率
减少模型“幻觉”(胡编)

通用问答系统
各类初始 / 基础版 RAG 实现

Hugging Face Transformers
Facebook's RAG Implementation
LangChain

<!-- 2 Agentic RAG -->

智能体式 RAG
Agentic RAG

支持自治智能体(Agents)
具备外部工具调用能力
动态检索与决策

能够处理复杂任务
更加主动的智能行为

智能个人助理
科研与分析助手
需要高交互性和动态响应的客服机器人

LangChain Agents
OpenAI GPT-4 with Plugins
Microsoft Semantic Kernel

图谱型 RAG
Graph RAG

利用知识图谱进行组织与检索
具备关系推理能力

信息更全面、更丰富
更好地处理复杂上下文

医疗、法律、工程等专家系统
语义搜索引擎

Neo4j Graph Database
Apache Jena
Stardog

<!-- 4 Modular RAG -->

模块化 RAG
Modular RAG

检索、推理、生成拆分为独立模块

灵活度高,可按需替换组件
可扩展性强,便于演进

需要多人协作开发的大型项目
需要频繁更新与维护的系统

Microservices Architecture
Docker &amp; Kubernetes
Apache Kafka

<!-- 5 Memory-Augmented RAG -->

记忆增强型 RAG
Memory-Augmented RAG

使用外部存储进行长期记忆与检索

可以在多轮对话中保持连续性
支持更高程度的个性化体验

需要维持长期上下文的聊天机器人
个性化推荐与用户画像系统

Redis for Session Storage
Amazon Dynamo DB
Pinecone Vector Database

<!-- 6 Multi-Modal RAG -->

多模态 RAG
Multi-Modal RAG

  • 跨模态检索(文本、图像、音频等)

回答形式更加丰富
更容易接入不同媒体内容

图像字幕生成
视频内容摘要
多模态智能助手

OpenAI's CLIP
TensorFlow Hub Models
PyTorch Multi-Modal Libraries

<!-- 7 Federated RAG -->

联邦式 RAG
Federated RAG

分布式 / 去中心化数据源
强调隐私保护

数据安全性更高
更容易满足合规要求

处理敏感数据的医疗系统
跨机构协同的数据分析平台

TensorFlow Federated
PySyft by OpenMined
Federated Learning Libraries

<!-- 8 Streaming RAG -->

流式 RAG
Streaming RAG

实时数据检索与生成

信息高度实时、始终最新
端到端延迟较低

直播 / 实时报道
金融行情与报价信息
社交媒体实时监控

Apache Kafka Streams
Amazon Kinesis
Stark Streaming

<!-- 9 ODQA RAG -->

开放域问答 RAG
ODQA RAG
(Open-Domain Question Answering)

覆盖广泛的大规模知识库
动态检索,适应多样问题

适用范围非常广
回答灵活,能处理开放式问题

搜索引擎问答
面向公众的虚拟助手

Elasticsearch
Haystack by Deepset
Hugging Face Transformers

<!-- 10 Contextual Retrieval RAG -->

语境检索型 RAG
Contextual Retrieval RAG

基于对话历史与上下文进行检索

更好地理解用户意图
保持对话连贯性

会话式 AI 聊天机器人
需要记住会话上下文的客服系统

Dialogflow by Google
Rasa Open Source
Microsoft Bot Framework

<!-- 11 Knowledge-Enhanced RAG -->

知识增强型 RAG
Knowledge-Enhanced RAG

集成结构化知识库与本体

事实性更强、错误更少
具备更深的领域专业知识

教育与学习工具
专业领域应用(法律、医学等)

Knowledge Graph Embeddings Libraries
OWL API
Apache Jena

<!-- 12 Domain-Specific RAG -->

领域定制 RAG
Domain-Specific RAG

针对特定行业或领域进行定制

与业务高度相关
更易满足行业合规要求
结果更可信、更可控

法律检索与合同分析助手
医疗诊断辅助系统
金融分析与风控工具

  • LexPredict Contract Analytics
  • Watson Health
  • Financial NLP Tools

<!-- 13 Hybrid RAG -->

混合式 RAG
Hybrid RAG

结合多种检索方式(如向量 + 关键词)

召回率更高
结果相关性更好

复杂问答系统
既需要语义匹配又需要词面匹配的搜索引擎

Elasticsearch with kNN Plugin
FAISS by Facebook AI
Hybrid Retrieval Libraries

<!-- 14 Self-RAG -->

自反式 RAG
Self-RAG

引入自我反思与自检机制
多轮迭代优化回答

显著提高回答准确度
增强整体逻辑性与连贯性

内容创作与编辑工具
要求高准确率的教育与培训平台

OpenAI GPT Models with Fine-Tuning
Human-in-the-Loop Platforms

<!-- 15 HyDE RAG -->

假设文档嵌入 RAG
HyDE RAG
(Hypothetical Document Embeddings)

先生成“假设文档”再进行向量化检索

召回效果更好,特别是隐含意图
整体答案质量更高

含有隐含需求、间接提问的复杂查询
小众 / 长尾领域的研究与助手工具

Custom Implementations with Transformers
Haystack Pipelines

<!-- 16 Recursive / Multi-Step RAG -->

递归 / 多步 RAG
Recursive / Multi-Step RAG

多轮、多阶段的检索与生成流程

推理能力更强
对复杂问题有更深入的理解

复杂分析与问题求解任务
需要多轮思考与互动的对话系统

LangChain's Chains and Agents
OpenMind's AlphaCode Framework

相关文章

JetBrains Junie 正式版:AI 编程 Agent 学会了用调试器断点
AI 编程开发
2026年6月19日
0 条评论
零重力瓦力

JetBrains Junie 正式版:AI 编程 Agent 学会了用调试器断点

JetBrains AI 编程 Agent Junie 正式 GA,在 SWE-Rebench 基准测试中排名第一。其核心优势在于深度集成 IDE 原生工具链,而非模拟替代。主要特性包括:Plan 模式生成结构化计划文档以防跑偏;原生调试器集成支持断点与运行时状态检查;支持异步远程控制长任务;基于项目上下文的交互式代码审查;以及模型自由切换以优化成本。Junie 标志着 AI 编程竞争正从模型能力转向工具集成深度。

#智能体#AI 编程
阅读全文
Visa 把支付网络接进了 ChatGPT,AI 智能体终于能自己花钱了
AI 新闻资讯
2026年6月18日
0 条评论
零重力瓦力

Visa 把支付网络接进了 ChatGPT,AI 智能体终于能自己花钱了

Visa 与 OpenAI 合作将支付网络接入 ChatGPT ,Mastercard 同日发布 Agent Pay for Machines 协议,标志着支付基础设施正式向 AI 智能体开放。Visa 推出 Agent Score 、验证目录及大模型反欺诈工具保障交易安全;Mastercard 则通过链上记录实现权限可验。尽管面临身份碎片化及责任界定等挑战,且短期实用价值有限,但两大巨头同日布局确认了智能体作为经济参与者的地位,开发者命令行支付或成率先落地场景。

#智能体
阅读全文
Google 搜索变身全天候智能体:Information Agents 上线,你的数据终于开始替你干活了
AI 产品工具
2026年6月15日
0 条评论
零重力瓦力

Google 搜索变身全天候智能体:Information Agents 上线,你的数据终于开始替你干活了

Google 推出 Information Agents 功能,面向 AI Ultra 订阅用户开放。该功能将搜索从被动查询转变为主动监测,智能体可 7×24 小时追踪用户需求并推送变化信息。其底层依托 Personal Intelligence 战略,通过整合 Gmail、Photos 等跨应用数据实现个性化推理。尽管存在隐私与准确性挑战,但凭借二十年数据积累,Google 正推动 AI 助手从对话工具向自主代理进化,重塑“信息找人”的交互范式。

#Google#智能体
阅读全文
互动讨论

评论区

围绕《16 种检索增强生成(RAG)类型》展开交流,未登录用户可浏览评论,登录后可参与讨论。

评论数
0
登录后参与评论
支持发表观点与回复一级评论,互动后将同步到消息中心。
登录后评论
暂无评论,欢迎成为第一个参与讨论的人。