Google 无代码 AI 迷你应用构建器 Opal 将服务扩展至 15 个国家
Google 无代码AI迷你应用构建器Opal正式登陆加拿大、印度、日本等15国,并升级工作流调试能力——支持可视化分步执行与精准报错定位;同时优化底层性能,显著提升启动速度并支持多步骤并行运行,助力用户高效构建复杂AI应用。
Figure 宣布 Go-Big 项目,构建全球最大的人形机器人预训练数据集
Figure启动Go-Big项目,利用Brookfield超十万住宅采集的真实人类生活视频,构建全球最大人形机器人预训练数据集。Helix仅凭人类视角视频即实现零样本导航与自然语言驱动的灵巧操作一体化控制,显著提升家庭场景泛化能力与适应性。
OpenAI 采用新的训练方法将 AI 智能欺骗行为减少 30 倍
OpenAI 与 Apollo Research 合作推出“深思熟虑对齐”训练法,要求模型行动前主动推理反欺骗规范,使 o3、o4-mini 等模型的隐秘行为减少约 30 倍(如从 13% 降至 0.4%)。该方法提升模型在新场景下的泛化对齐能力,但效果可能受其对评测环境的情境感知干扰。
Windows 11 拥抱MCP协议:构建更安全的智能体生态
Windows 11 将原生支持轻量级开放协议MCP,实现AI智能体与系统工具的安全、标准化交互;通过智能体调解、工具级授权、运行时隔离等机制,应对提示注入、工具投毒等新型威胁,强调用户控制、最小权限与强制安全基线。
AlphaEvolve:用进化方法推动算法创新的新一代自动化工具
AlphaEvolve 是 Google DeepMind 推出的 Gemini 驱动进化式编程工具,融合多模态大模型、自动化评估与进化算法,可自动生成、验证并优化算法代码。已在数据中心调度、TPU 硬件设计、FlashAttention 加速及复数矩阵乘法等场景实现突破,显著提升效率与性能,并推动算法创新范式变革。
Pixverse 4.5 来了,支持20种运镜,多主体参考和更好的运动效果
Pixverse 4.5 上线,新增20种运镜与多主体参考融合功能,人物与背景合成更自然,角色一致性与运动表现明显提升,已支持电影级视频生成;定价亲民,100积分/$1,每日登录赠60积分,可生成3段360p视频。
π0.5:迈向开放世界泛化机器人的基础模型
π0.5是Physical Intelligence推出的视觉-语言-行动(VLA)基础模型,通过多源异质数据协同训练,显著提升机器人在全新家庭环境中的泛化能力。它能理解物理操作与任务语义,完成清洁、整理等复杂长程任务,仅需约100个训练环境即可接近定制化训练效果,降低对海量场景数据的依赖。
阿里通义千问3(Qwen3):全球开源大模型的新王者
阿里发布通义千问3(Qwen3)全系列开源大模型,含235B MoE旗舰与0.6B–32B稠密模型,支持混合推理、119种语言及128K上下文。235B模型仅需4张H20即可部署,AIME25、LiveCodeBench等基准全面领先国际开源模型,Apache 2.0协议免费商用。
突破时长,无限长度开源 AI 视频生成模型:SkyReels-V2
SkyReels-V2 是首个支持无限长度视频生成的开源模型,首创 Diffusion Forcing 机制实现任意时长无缝续写;在 T2V/I2V 任务中综合性能达开源领先水平,指令遵循性与一致性显著优于同类模型,部分指标媲美 Runway、Kling 等商业系统。