16 种检索增强生成（RAG）类型

类型	关键特性	优势	应用/需求	工具/库示例
标准 RAG Standard RAG (RAG-Sequence 和 RAG-Token)	基础的检索与生成集成支持 RAG-Sequence 与 RAG-Token 两种变体提高回答准确率减少模型“幻觉”（胡编）通用问答系统各类初始 / 基础版 RAG 实现 Hugging Face Transformers Facebook's RAG Implementation LangChain <!-- 2 Agentic RAG --> 智能体式 RAG Agentic RAG 支持自治智能体（Agents）具备外部工具调用能力动态检索与决策能够处理复杂任务更加主动的智能行为智能个人助理科研与分析助手需要高交互性和动态响应的客服机器人 LangChain Agents OpenAI GPT-4 with Plugins Microsoft Semantic Kernel 图谱型 RAG Graph RAG 利用知识图谱进行组织与检索具备关系推理能力信息更全面、更丰富更好地处理复杂上下文医疗、法律、工程等专家系统语义搜索引擎 Neo4j Graph Database Apache Jena Stardog <!-- 4 Modular RAG --> 模块化 RAG Modular RAG 检索、推理、生成拆分为独立模块灵活度高，可按需替换组件可扩展性强，便于演进需要多人协作开发的大型项目需要频繁更新与维护的系统 Microservices Architecture Docker & Kubernetes Apache Kafka <!-- 5 Memory-Augmented RAG --> 记忆增强型 RAG Memory-Augmented RAG 使用外部存储进行长期记忆与检索可以在多轮对话中保持连续性支持更高程度的个性化体验需要维持长期上下文的聊天机器人个性化推荐与用户画像系统 Redis for Session Storage Amazon Dynamo DB Pinecone Vector Database <!-- 6 Multi-Modal RAG --> 多模态 RAG Multi-Modal RAG 跨模态检索（文本、图像、音频等）回答形式更加丰富更容易接入不同媒体内容图像字幕生成视频内容摘要多模态智能助手 OpenAI's CLIP TensorFlow Hub Models PyTorch Multi-Modal Libraries <!-- 7 Federated RAG --> 联邦式 RAG Federated RAG 分布式 / 去中心化数据源强调隐私保护数据安全性更高更容易满足合规要求处理敏感数据的医疗系统跨机构协同的数据分析平台 TensorFlow Federated PySyft by OpenMined Federated Learning Libraries <!-- 8 Streaming RAG --> 流式 RAG Streaming RAG 实时数据检索与生成信息高度实时、始终最新端到端延迟较低直播 / 实时报道金融行情与报价信息社交媒体实时监控 Apache Kafka Streams Amazon Kinesis Stark Streaming <!-- 9 ODQA RAG --> 开放域问答 RAG ODQA RAG (Open-Domain Question Answering) 覆盖广泛的大规模知识库动态检索，适应多样问题适用范围非常广回答灵活，能处理开放式问题搜索引擎问答面向公众的虚拟助手 Elasticsearch Haystack by Deepset Hugging Face Transformers <!-- 10 Contextual Retrieval RAG --> 语境检索型 RAG Contextual Retrieval RAG 基于对话历史与上下文进行检索更好地理解用户意图保持对话连贯性会话式 AI 聊天机器人需要记住会话上下文的客服系统 Dialogflow by Google Rasa Open Source Microsoft Bot Framework <!-- 11 Knowledge-Enhanced RAG --> 知识增强型 RAG Knowledge-Enhanced RAG 集成结构化知识库与本体事实性更强、错误更少具备更深的领域专业知识教育与学习工具专业领域应用（法律、医学等） Knowledge Graph Embeddings Libraries OWL API Apache Jena <!-- 12 Domain-Specific RAG --> 领域定制 RAG Domain-Specific RAG 针对特定行业或领域进行定制与业务高度相关更易满足行业合规要求结果更可信、更可控法律检索与合同分析助手医疗诊断辅助系统金融分析与风控工具 LexPredict Contract Analytics Watson Health Financial NLP Tools <!-- 13 Hybrid RAG --> 混合式 RAG Hybrid RAG 结合多种检索方式（如向量 + 关键词）召回率更高结果相关性更好复杂问答系统既需要语义匹配又需要词面匹配的搜索引擎 Elasticsearch with kNN Plugin FAISS by Facebook AI Hybrid Retrieval Libraries <!-- 14 Self-RAG --> 自反式 RAG Self-RAG 引入自我反思与自检机制多轮迭代优化回答显著提高回答准确度增强整体逻辑性与连贯性内容创作与编辑工具要求高准确率的教育与培训平台 OpenAI GPT Models with Fine-Tuning Human-in-the-Loop Platforms <!-- 15 HyDE RAG --> 假设文档嵌入 RAG HyDE RAG (Hypothetical Document Embeddings) 先生成“假设文档”再进行向量化检索召回效果更好，特别是隐含意图整体答案质量更高含有隐含需求、间接提问的复杂查询小众 / 长尾领域的研究与助手工具 Custom Implementations with Transformers Haystack Pipelines <!-- 16 Recursive / Multi-Step RAG --> 递归 / 多步 RAG Recursive / Multi-Step RAG 多轮、多阶段的检索与生成流程推理能力更强对复杂问题有更深入的理解复杂分析与问题求解任务需要多轮思考与互动的对话系统 LangChain's Chains and Agents OpenMind's AlphaCode Framework 相关文章 AI 编程开发 2026年7月11日 0 条评论零重力瓦力一个人用 Claude 把 53 万行 Zig 重写成 Rust Bun 开发者利用 Claude Fable 5 在 11 天内将 53.5 万行 Zig 代码重写为 Rust，以解决内存安全问题。项目采用 64 个 AI 实例并行及对抗性审查机制，耗资约 16.5 万美元。重写后二进制体积缩减 20%，性能提升 2% 至 5%。尽管存在 1.3 万个 unsafe 块和 19 个回归问题引发争议，但该项目验证了 AI 辅助大规模重构的可行性，其分离上下文与对抗审查等方法论具有重要参考价值。 #Claude Code#AI 编程阅读全文 AI 编程开发 2026年6月19日 0 条评论零重力瓦力 JetBrains Junie 正式版：AI 编程 Agent 学会了用调试器断点 JetBrains AI 编程 Agent Junie 正式 GA，在 SWE-Rebench 基准测试中排名第一。其核心优势在于深度集成 IDE 原生工具链，而非模拟替代。主要特性包括：Plan 模式生成结构化计划文档以防跑偏；原生调试器集成支持断点与运行时状态检查；支持异步远程控制长任务；基于项目上下文的交互式代码审查；以及模型自由切换以优化成本。Junie 标志着 AI 编程竞争正从模型能力转向工具集成深度。 #智能体#AI 编程阅读全文 AI 新闻资讯 2026年6月18日 0 条评论零重力瓦力 Visa 把支付网络接进了 ChatGPT，AI 智能体终于能自己花钱了 Visa 与 OpenAI 合作将支付网络接入 ChatGPT ，Mastercard 同日发布 Agent Pay for Machines 协议，标志着支付基础设施正式向 AI 智能体开放。Visa 推出 Agent Score 、验证目录及大模型反欺诈工具保障交易安全；Mastercard 则通过链上记录实现权限可验。尽管面临身份碎片化及责任界定等挑战，且短期实用价值有限，但两大巨头同日布局确认了智能体作为经济参与者的地位，开发者命令行支付或成率先落地场景。 #智能体阅读全文互动讨论评论区围绕《16 种检索增强生成（RAG）类型》展开交流，未登录用户可浏览评论，登录后可参与讨论。评论数 0 登录后参与评论支持发表观点与回复一级评论，互动后将同步到消息中心。登录后评论暂无评论，欢迎成为第一个参与讨论的人。创艺提示符，帮你写出更好的提示词！ Copyright © 2026 上海创艺提示符科技有限公司 - All rights reserved 沪ICP备18007549号-3 沪公网安备31010102007903

类型

关键特性

优势

应用/需求

工具/库示例

标准 RAG
Standard RAG
(RAG-Sequence 和 RAG-Token)

基础的检索与生成集成
支持 RAG-Sequence 与 RAG-Token 两种变体

提高回答准确率
减少模型“幻觉”（胡编）

通用问答系统
各类初始 / 基础版 RAG 实现

Hugging Face Transformers
Facebook's RAG Implementation
LangChain

智能体式 RAG
Agentic RAG

支持自治智能体（Agents）
具备外部工具调用能力
动态检索与决策

能够处理复杂任务
更加主动的智能行为

智能个人助理
科研与分析助手
需要高交互性和动态响应的客服机器人

LangChain Agents
OpenAI GPT-4 with Plugins
Microsoft Semantic Kernel

图谱型 RAG
Graph RAG

利用知识图谱进行组织与检索
具备关系推理能力

信息更全面、更丰富
更好地处理复杂上下文

医疗、法律、工程等专家系统
语义搜索引擎

Neo4j Graph Database
Apache Jena
Stardog

模块化 RAG
Modular RAG

检索、推理、生成拆分为独立模块

灵活度高，可按需替换组件
可扩展性强，便于演进

需要多人协作开发的大型项目
需要频繁更新与维护的系统

Microservices Architecture
Docker & Kubernetes
Apache Kafka

记忆增强型 RAG
Memory-Augmented RAG

使用外部存储进行长期记忆与检索

可以在多轮对话中保持连续性
支持更高程度的个性化体验

需要维持长期上下文的聊天机器人
个性化推荐与用户画像系统

Redis for Session Storage
Amazon Dynamo DB
Pinecone Vector Database

多模态 RAG
Multi-Modal RAG

跨模态检索（文本、图像、音频等）

回答形式更加丰富
更容易接入不同媒体内容

图像字幕生成
视频内容摘要
多模态智能助手

OpenAI's CLIP
TensorFlow Hub Models
PyTorch Multi-Modal Libraries

联邦式 RAG
Federated RAG

分布式 / 去中心化数据源
强调隐私保护

数据安全性更高
更容易满足合规要求

处理敏感数据的医疗系统
跨机构协同的数据分析平台

TensorFlow Federated
PySyft by OpenMined
Federated Learning Libraries

流式 RAG
Streaming RAG

实时数据检索与生成

信息高度实时、始终最新
端到端延迟较低

直播 / 实时报道
金融行情与报价信息
社交媒体实时监控

Apache Kafka Streams
Amazon Kinesis
Stark Streaming

开放域问答 RAG
ODQA RAG
(Open-Domain Question Answering)

覆盖广泛的大规模知识库
动态检索，适应多样问题

适用范围非常广
回答灵活，能处理开放式问题

搜索引擎问答
面向公众的虚拟助手

Elasticsearch
Haystack by Deepset
Hugging Face Transformers

语境检索型 RAG
Contextual Retrieval RAG

基于对话历史与上下文进行检索

更好地理解用户意图
保持对话连贯性

会话式 AI 聊天机器人
需要记住会话上下文的客服系统

Dialogflow by Google
Rasa Open Source
Microsoft Bot Framework

知识增强型 RAG
Knowledge-Enhanced RAG

集成结构化知识库与本体

事实性更强、错误更少
具备更深的领域专业知识

教育与学习工具
专业领域应用（法律、医学等）

Knowledge Graph Embeddings Libraries
OWL API
Apache Jena

领域定制 RAG
Domain-Specific RAG

针对特定行业或领域进行定制

与业务高度相关
更易满足行业合规要求
结果更可信、更可控

法律检索与合同分析助手
医疗诊断辅助系统
金融分析与风控工具

LexPredict Contract Analytics
Watson Health
Financial NLP Tools

混合式 RAG
Hybrid RAG

结合多种检索方式（如向量 + 关键词）

召回率更高
结果相关性更好

复杂问答系统
既需要语义匹配又需要词面匹配的搜索引擎

Elasticsearch with kNN Plugin
FAISS by Facebook AI
Hybrid Retrieval Libraries

自反式 RAG
Self-RAG

引入自我反思与自检机制
多轮迭代优化回答

显著提高回答准确度
增强整体逻辑性与连贯性

内容创作与编辑工具
要求高准确率的教育与培训平台

OpenAI GPT Models with Fine-Tuning
Human-in-the-Loop Platforms

假设文档嵌入 RAG
HyDE RAG
(Hypothetical Document Embeddings)

先生成“假设文档”再进行向量化检索

召回效果更好，特别是隐含意图
整体答案质量更高

含有隐含需求、间接提问的复杂查询
小众 / 长尾领域的研究与助手工具

Custom Implementations with Transformers
Haystack Pipelines

递归 / 多步 RAG
Recursive / Multi-Step RAG

多轮、多阶段的检索与生成流程

推理能力更强
对复杂问题有更深入的理解

复杂分析与问题求解任务
需要多轮思考与互动的对话系统

LangChain's Chains and Agents
OpenMind's AlphaCode Framework

一个人用 Claude 把 53 万行 Zig 重写成 Rust

Bun 开发者利用 Claude Fable 5 在 11 天内将 53.5 万行 Zig 代码重写为 Rust，以解决内存安全问题。项目采用 64 个 AI 实例并行及对抗性审查机制，耗资约 16.5 万美元。重写后二进制体积缩减 20%，性能提升 2% 至 5%。尽管存在 1.3 万个 unsafe 块和 19 个回归问题引发争议，但该项目验证了 AI 辅助大规模重构的可行性，其分离上下文与对抗审查等方法论具有重要参考价值。

JetBrains Junie 正式版：AI 编程 Agent 学会了用调试器断点

JetBrains AI 编程 Agent Junie 正式 GA，在 SWE-Rebench 基准测试中排名第一。其核心优势在于深度集成 IDE 原生工具链，而非模拟替代。主要特性包括：Plan 模式生成结构化计划文档以防跑偏；原生调试器集成支持断点与运行时状态检查；支持异步远程控制长任务；基于项目上下文的交互式代码审查；以及模型自由切换以优化成本。Junie 标志着 AI 编程竞争正从模型能力转向工具集成深度。

Visa 把支付网络接进了 ChatGPT，AI 智能体终于能自己花钱了

Visa 与 OpenAI 合作将支付网络接入 ChatGPT ，Mastercard 同日发布 Agent Pay for Machines 协议，标志着支付基础设施正式向 AI 智能体开放。Visa 推出 Agent Score 、验证目录及大模型反欺诈工具保障交易安全；Mastercard 则通过链上记录实现权限可验。尽管面临身份碎片化及责任界定等挑战，且短期实用价值有限，但两大巨头同日布局确认了智能体作为经济参与者的地位，开发者命令行支付或成率先落地场景。

#智能体

阅读全文

互动讨论

评论区

围绕《16 种检索增强生成（RAG）类型》展开交流，未登录用户可浏览评论，登录后可参与讨论。

评论数

登录后参与评论

支持发表观点与回复一级评论，互动后将同步到消息中心。

登录后评论

暂无评论，欢迎成为第一个参与讨论的人。

相关文章

一个人用 Claude 把 53 万行 Zig 重写成 Rust

JetBrains Junie 正式版：AI 编程 Agent 学会了用调试器断点

Visa 把支付网络接进了 ChatGPT，AI 智能体终于能自己花钱了

评论区