AI 科普达人 New Machina 介绍了一种新的智能体设计思路:智能体 RAG。

传统的 RAG 模式已经在实践中证明了其价值。它通过将大语言模型与向量数据库结合,能够实时检索相关信息并生成更准确的回答。但这种模式存在一个局限:检索过程是一次性的,且大语言模型只有一次生成响应的机会。这就好比让一个人在只能查阅一次资料的情况下直接给出最终答案,而不能根据需要多次查证和思考。

而这种 “智能体RAG” 能够突破这一限制。在这种新的模式下,大语言模型可以像人类专家那样,根据初步推理结果判断是否需要获取更多信息,然后有针对性地调用不同的检索工具,甚至可以在多个数据源之间交叉验证。这种 "推理-行动" (ReAct)的交替过程使得系统能够逐步完善其理解,最终得出更全面准确的答案!