Figure 新型 Helix 机器人学习提速 12 倍,30 天学会物流小包裹分拣
Figure AI推出Helix模型,搭载该模型的Figure 02机器人在物流小包裹分拣任务中学习效率提升12倍:首个客户应用耗时12个月,第二个仅用30天即完成部署并现场稳定运行,展现端到端自主学习与跨场景泛化能力。
Meta 计划推出独立 Meta AI 应用,全力竞争 ChatGPT 赛道
Meta将于2025年第二季度推出独立Meta AI应用,摆脱社交平台限制,支持跨设备交互;目标年底成为全球使用量最高的AI聊天工具,并可能推出类似ChatGPT Plus的付费订阅服务。
OpenAI 推出 GPT-4.5:更强大、更智能、更贴近人类的 AI 模型
OpenAI发布GPT-4.5研究预览版,在无监督学习上大幅突破:SimpleQA准确率达62.5%,幻觉率降至37.1%,显著优于GPT-4o与o3-mini;情感理解更细腻,创意与知识整合能力更强,交互更自然可信。
OpenAI Deep Research 团队探讨强化学习为何是智能体的未来
OpenAI Deep Research团队指出,强化学习通过端到端优化直接对齐用户目标,是构建自主智能体的核心路径;其基于o3模型微调的智能体可自主浏览网络、调用工具、生成深度报告,在市场研究、编程等场景已落地,团队预测2025年为“智能体之年”。
DeepSeek-R1 让 Blackwell 架构的性能大升级
英伟达推出TensorRT优化的FP4版DeepSeek-R1,运行于Blackwell架构时相较H100提升25倍收益、降低单Token成本20倍;MMLU测试达FP8版本99.8%精度,兼顾速度与准确率;FP4模型已开源至Hugging Face。
Claude 3.7 Sonnet 横空出世:程序员的最爱 or 最大威胁?
Claude 3.7 Sonnet 编程能力突出,GitHub 问题解决率达 73%,命令行工具 Claude Code 支持代码构建、测试与执行;已分流 Stack Overflow 流量,但对新兴语言支持弱、复杂任务受限,且定价偏高($15/百万输出 Token)。
微软全方位防御 AI "越狱" 和 Prompt 攻击
微软推出Prompt Shields等多层防御方案,实时检测并阻断AI“越狱”与隐蔽的间接提示攻击;结合安全评估工具、Defender for Cloud与Purview,覆盖开发、部署与数据管理全链路,助力企业安全落地生成式AI应用。
NEO Gamma:人形机器人即将走进家庭
1X Technologies推出的NEO Gamma是首款进入家庭内测的仿人机器人,采用柔软针织外壳与“情感耳环”设计,支持自然步态、坐卧拾物等拟人动作,并搭载自主语言模型,可理解上下文、多步指令及肢体交互,真正迈向日常陪伴。
Figure AI 兑现承诺,人形机器人 Figure 02 展示推理能力
Figure 02 展示真正自主推理能力:自研多模态AI可识别环境、理解陌生物体并自主决策放置位置,初步具备协作能力;虽当前动作较慢,但投资人预计其速度未来可达人类1.2–1.5倍,通用人形机器人正进入自学新阶段。