今年,智能体赛道彻底火了。OpenAI 和 Google 相继推出了具备多步推理和网页访问能力的深度研究(Deep Research)功能,而智谱也不甘示弱,上线了一款重磅产品:AutoGLM 沉思。经过一番实测,发现这款能够 “自己动手” 的 AI 真有后来者居上的势头!
为了测试它的能力,我让 AutoGLM 沉思为我制定一份 ComfyUI 的学习方案。

任务开始后,AutoGLM 沉思自动打开了浏览器,逐一访问知乎、B站、GitCode 等 14 个网站。与 OpenAI Deep Research 不同的是,它不仅能提取网页中的内容,还能 “自己动手” 进行搜索操作。如果遇到需要登录才能访问的页面,它会自动暂停,并提示用户配合完成操作。整个过程完全透明,我们可以实时监控它的每一步操作,并且随时可以中断。
整个“沉思”过程耗时 9 分 35 秒,进度清晰可见。最终的研究结果也相当完善,从 ComfyUI 的基础认知、安装配置、核心概念与界面导航,到学习路径与资源推荐,再到使用技巧和常见问题,都一一列举出来(图3)。不过,内容整体偏大纲化,缺乏具体细节,也没有引用来源,这一点希望未来能有所改进。
相比之下,OpenAI 和 Google 的 Deep Research 更像是“思考者”。它们擅长阅读、总结信息,并生成结构清晰的报告,但有一个明显的短板,它们不会“动手”。很多有价值的信息藏在小红书、公众号、知乎等没有 API 或无法直接抓取内容的平台上,ChatGPT 和 Gemini 都无法直接获取这些信源,需要用户自己去点、去找。而 AutoGLM 沉思则不同,它更像是一个真正的人类研究员,不仅能拆解复杂问题、推理分析,还能自己打开网页、浏览信息,甚至读取图文内容。
更重要的是,ChatGPT 的 Deep Research 功能每月收费 200 美元,还限制使用次数,而智谱的 AutoGLM 沉思则是免费且不限量使用,还不需要魔法上网。如果说 ChatGPT 是一个聪明的顾问,那么 AutoGLM 沉思更像是一个既能查资料、写报告,又能自己上网找素材的实习生,而且还不用发工资。
智谱 AutoGLM 沉思客户端下载地址:https://autoglm-research.zhipuai.cn/
目前 AutoGLM 沉思只能操作 Chrome 浏览器,并且需要安装 AutoGLM 的插件。
评论(0)