Gemini Robotics:让 AI 走入现实世界
Google DeepMind推出基于Gemini 2.0的两款具身智能模型:Gemini Robotics具备视觉-语言-行动能力,可直接控制ALOHA 2、Franka及人形机器人“阿波罗”;Gemini Robotics-ER强化空间理解与具身推理,任务成功率提升2–3倍,并引入分层安全机制与ASIMOV安全评估数据集。
Google 发布轻量级开源大模型:Gemma 3,让手机也能跑动大模型
Google发布开源大模型Gemma 3,含1B至27B多版本,其中1B版可在手机端流畅运行;原生支持140+语言及文本、图像、视频多模态输入,上下文窗口达12.8万Token;兼容Transformers、JAX等主流框架,继承Gemini 2.0核心技术,兼顾性能与终端部署效率。
为什么 OpenAI 的 Agent SDK 对智能体开发带来巨大变革
OpenAI 推出 Agent SDK,将智能体开发从几周压缩至几分钟。它以轻量设计、Python 原生支持、自动工具循环、函数装饰器转 AI 工具、智能体间任务交接、内置安全校验与可视化调试为核心,显著降低开发门槛,提升智能体的可靠性与可维护性。
OpenAI 将发布开源智能体开发框架
OpenAI 推出开源智能体开发框架,含响应式 API(支持多模态、网页/文件搜索、计算机操控)和重构的智能体 SDK(支持多智能体协作、任务交接与全链路监控),推动 AI 从问答迈向自主执行;旧助手 API 将于 2026 年停用。
Ted AI 播客主持人 Bilawal Sidhu 的 Manus AI 测评
Ted AI 主持人 Bilawal Sidhu 实测 Manus AI:33分钟内自主完成无人机合规选址、个性化音乐节行程规划、多维酒店推荐等复杂任务,初步实现“替代人类操作电脑”;受限于上下文长度与网站访问,但已展现智能体实用潜力。
人们在构建智能体(AI Agent)时最常犯的错误
人类学研究员Erik Schluntz指出,开发者构建AI智能体时最常犯的错误是重提示词、轻工具设计:花大量精力优化提示语,却忽视工具接口的命名规范与文档说明。这源于对AI本质的误解——模型需通过自然语言理解工具,而非像传统程序那样执行指令。
Manus 创建了自身开源替代方案:Anus
AI 工程师 Nik McFly 借助 Manus AI,在 25 分钟内全自动完成开源项目 Anus 的设计、编码、文档与架构搭建,目标是提供 Manus 的开源替代方案;代码已发布至 GitHub。
RAG 与 ReAct:两种提升大语言模型能力的关键方法
RAG通过向量检索外部知识提升回答准确性,适合专业领域问答;ReAct让模型边推理边调用工具,擅长多步骤复杂任务。二者分别拓展知识广度与推理深度,可独立使用或协同集成,是构建实用AI应用的关键路径。
挑战 AI 巨头的新力量:Manus AI 功能分析和测评
Manus AI 是一款尚未全面开放的云端AI助手,擅长多任务协同与异步执行,在简历筛选、房产研究、财务分析等复杂场景中表现突出;其报告产出量达OpenAI Deep Research两倍,GAIA基准测试位居业界前列,标志国产AI Agent在垂直领域实现关键突破。