16 种检索增强生成(RAG)类型

本文系统梳理16种RAG变体,从标准、智能体式到图谱、多模态、联邦、流式等,覆盖关键特性、适用场景与主流工具,为不同业务需求下的检索增强生成方案选型提供清晰参考。

发布于2025年12月7日 13:11
编辑零重力瓦力
评论0
阅读21

16 种检索增强生成(RAG)类型

类型 关键特性 优势 应用/需求 工具/库示例
标准 RAG
Standard RAG
(RAG-Sequence 和 RAG-Token)
  • 基础的检索与生成集成
  • 支持 RAG-Sequence 与 RAG-Token 两种变体

提高回答准确率
减少模型“幻觉”(胡编)

通用问答系统
各类初始 / 基础版 RAG 实现

Hugging Face Transformers
Facebook's RAG Implementation
LangChain

<!-- 2 Agentic RAG -->

智能体式 RAG
Agentic RAG

支持自治智能体(Agents)
具备外部工具调用能力
动态检索与决策

能够处理复杂任务
更加主动的智能行为

智能个人助理
科研与分析助手
需要高交互性和动态响应的客服机器人

LangChain Agents
OpenAI GPT-4 with Plugins
Microsoft Semantic Kernel

图谱型 RAG
Graph RAG

利用知识图谱进行组织与检索
具备关系推理能力

信息更全面、更丰富
更好地处理复杂上下文

医疗、法律、工程等专家系统
语义搜索引擎

Neo4j Graph Database
Apache Jena
Stardog

<!-- 4 Modular RAG -->

模块化 RAG
Modular RAG

检索、推理、生成拆分为独立模块

灵活度高,可按需替换组件
可扩展性强,便于演进

需要多人协作开发的大型项目
需要频繁更新与维护的系统

Microservices Architecture
Docker &amp; Kubernetes
Apache Kafka

<!-- 5 Memory-Augmented RAG -->

记忆增强型 RAG
Memory-Augmented RAG

使用外部存储进行长期记忆与检索

可以在多轮对话中保持连续性
支持更高程度的个性化体验

需要维持长期上下文的聊天机器人
个性化推荐与用户画像系统

Redis for Session Storage
Amazon Dynamo DB
Pinecone Vector Database

<!-- 6 Multi-Modal RAG -->

多模态 RAG
Multi-Modal RAG

  • 跨模态检索(文本、图像、音频等)

回答形式更加丰富
更容易接入不同媒体内容

图像字幕生成
视频内容摘要
多模态智能助手

OpenAI's CLIP
TensorFlow Hub Models
PyTorch Multi-Modal Libraries

<!-- 7 Federated RAG -->

联邦式 RAG
Federated RAG

分布式 / 去中心化数据源
强调隐私保护

数据安全性更高
更容易满足合规要求

处理敏感数据的医疗系统
跨机构协同的数据分析平台

TensorFlow Federated
PySyft by OpenMined
Federated Learning Libraries

<!-- 8 Streaming RAG -->

流式 RAG
Streaming RAG

实时数据检索与生成

信息高度实时、始终最新
端到端延迟较低

直播 / 实时报道
金融行情与报价信息
社交媒体实时监控

Apache Kafka Streams
Amazon Kinesis
Stark Streaming

<!-- 9 ODQA RAG -->

开放域问答 RAG
ODQA RAG
(Open-Domain Question Answering)

覆盖广泛的大规模知识库
动态检索,适应多样问题

适用范围非常广
回答灵活,能处理开放式问题

搜索引擎问答
面向公众的虚拟助手

Elasticsearch
Haystack by Deepset
Hugging Face Transformers

<!-- 10 Contextual Retrieval RAG -->

语境检索型 RAG
Contextual Retrieval RAG

基于对话历史与上下文进行检索

更好地理解用户意图
保持对话连贯性

会话式 AI 聊天机器人
需要记住会话上下文的客服系统

Dialogflow by Google
Rasa Open Source
Microsoft Bot Framework

<!-- 11 Knowledge-Enhanced RAG -->

知识增强型 RAG
Knowledge-Enhanced RAG

集成结构化知识库与本体

事实性更强、错误更少
具备更深的领域专业知识

教育与学习工具
专业领域应用(法律、医学等)

Knowledge Graph Embeddings Libraries
OWL API
Apache Jena

<!-- 12 Domain-Specific RAG -->

领域定制 RAG
Domain-Specific RAG

针对特定行业或领域进行定制

与业务高度相关
更易满足行业合规要求
结果更可信、更可控

法律检索与合同分析助手
医疗诊断辅助系统
金融分析与风控工具

  • LexPredict Contract Analytics
  • Watson Health
  • Financial NLP Tools

<!-- 13 Hybrid RAG -->

混合式 RAG
Hybrid RAG

结合多种检索方式(如向量 + 关键词)

召回率更高
结果相关性更好

复杂问答系统
既需要语义匹配又需要词面匹配的搜索引擎

Elasticsearch with kNN Plugin
FAISS by Facebook AI
Hybrid Retrieval Libraries

<!-- 14 Self-RAG -->

自反式 RAG
Self-RAG

引入自我反思与自检机制
多轮迭代优化回答

显著提高回答准确度
增强整体逻辑性与连贯性

内容创作与编辑工具
要求高准确率的教育与培训平台

OpenAI GPT Models with Fine-Tuning
Human-in-the-Loop Platforms

<!-- 15 HyDE RAG -->

假设文档嵌入 RAG
HyDE RAG
(Hypothetical Document Embeddings)

先生成“假设文档”再进行向量化检索

召回效果更好,特别是隐含意图
整体答案质量更高

含有隐含需求、间接提问的复杂查询
小众 / 长尾领域的研究与助手工具

Custom Implementations with Transformers
Haystack Pipelines

<!-- 16 Recursive / Multi-Step RAG -->

递归 / 多步 RAG
Recursive / Multi-Step RAG

多轮、多阶段的检索与生成流程

推理能力更强
对复杂问题有更深入的理解

复杂分析与问题求解任务
需要多轮思考与互动的对话系统

LangChain's Chains and Agents
OpenMind's AlphaCode Framework

相关文章

互动讨论

评论区

围绕《16 种检索增强生成(RAG)类型》展开交流,未登录用户可浏览评论,登录后可参与讨论。

评论数
0
登录后参与评论
支持发表观点与回复一级评论,互动后将同步到消息中心。
登录后评论
暂无评论,欢迎成为第一个参与讨论的人。