谷歌发布 Agent2Agent 协议(A2A),实现智能体互动操作
谷歌发布开源Agent2Agent(A2A)协议,为异构AI智能体提供统一通信标准,支持跨厂商、跨框架协作,具备安全认证、长任务处理与多模态能力;通过“Agent Card”实现动态能力发现,已获超50家技术及咨询公司支持。
Google 推出开源智能体开发工具包:ADK( Agent Development Kit)
Google 开源智能体开发工具包 ADK,让构建智能体如写函数般简单。支持 Gemini 等任意大模型,兼容本地与云端部署,原生集成音视频流和 UI 沙盒调试。百行代码即可实现多智能体旅行规划应用,推动智能体开发标准化与落地。
Google 发布全栈 AI 编程工具 Firebase Studio
Google 推出 Firebase Studio,一款集成 Gemini 的全栈 AI 编程工具,支持自然语言/线框图/截图生成应用原型,可导入多源代码库并用 Nix 定制环境。实测能快速生成 TypeScript + React 项目,虽界面简陋但支持 Gemini 实时迭代优化,提供免费浏览器端开发方案。
Google AI Studio 可免费制作 Veo 2 视频啦!
Google AI Studio 现免费开放 Veo 2 视频生成功能,支持文生视频与图生视频,可选横屏(16:9)或竖屏(9:16)格式,最快1分钟生成一段8秒高清视频,无需订阅即可体验。
Google Labs 副总裁 Josh Woodward 聊 AI 视频的未来
Google Labs副总裁Josh Woodward提出“AI摄像机”构想:它不是拍摄工具,而是能对成片中任意元素(如角色服饰颜色)进行全局实时修改的创作系统,将大幅降低影视制作门槛,重塑从创作到后期的全流程。
智能体还是智能体工作流
智能体强调大模型驱动的自主决策与非确定性执行,适合复杂灵活任务;智能体工作流则将AI能力嵌入预设流程,强调确定性、可控性与人工干预,更适配需稳定输出的业务场景。二者本质是自主性与可控性的权衡。
Gemini Robotics:让 AI 走入现实世界
Google DeepMind推出基于Gemini 2.0的两款具身智能模型:Gemini Robotics具备视觉-语言-行动能力,可直接控制ALOHA 2、Franka及人形机器人“阿波罗”;Gemini Robotics-ER强化空间理解与具身推理,任务成功率提升2–3倍,并引入分层安全机制与ASIMOV安全评估数据集。
Google 发布轻量级开源大模型:Gemma 3,让手机也能跑动大模型
Google发布开源大模型Gemma 3,含1B至27B多版本,其中1B版可在手机端流畅运行;原生支持140+语言及文本、图像、视频多模态输入,上下文窗口达12.8万Token;兼容Transformers、JAX等主流框架,继承Gemini 2.0核心技术,兼顾性能与终端部署效率。
Meta 计划推出独立 Meta AI 应用,全力竞争 ChatGPT 赛道
Meta将于2025年第二季度推出独立Meta AI应用,摆脱社交平台限制,支持跨设备交互;目标年底成为全球使用量最高的AI聊天工具,并可能推出类似ChatGPT Plus的付费订阅服务。