Runway 年终 5 大升级 向通用世界模型迈出一大步
Runway 年终发布五大升级,核心是 Gen-4.5 多模态视频模型(支持有声电影生成与音画协同编辑)和通用世界模型 GWM-1;后者涵盖虚拟空间构建(GWM Worlds)、高保真数字人(GWM Avatars)、机器人训练模拟(GWM Robotics),并联合英伟达等共建大规模训练平台。
Nano Banana Pro + Sora 2 一键生成 MV
AI博主yachimat演示Nano Banana Pro与Sora 2联动:先用前者生成带镜头运动标注的3×3分镜图,再喂给Sora 2,一键输出完整MV,大幅降低专业级视觉内容创作门槛。
可灵全能视频模型 O1 实测及亮点解析
可灵O1首次实现视频生成与编辑一体化,支持文字、图片、视频多模态输入,能续拍、换景、换人、改风格、去元素等操作一键完成;角色与场景一致性显著提升,支持3–10秒自定义时长,大幅提高创作效率。
Meta 开源代码导航工具 Pyrefly
Meta 开源 Python 代码导航工具 Pyrefly,支持快速跳转定义与引用,并内置高性能类型检查,专为大型项目优化,已在 Instagram 内部落地验证。提供 VS Code、PyCharm、Neovim 等插件,兼容 Pydantic 和 Django,类型规范支持率达 70%,附在线文档与沙盒试用。
Runway 转型一站式 AI 创作平台
Runway 正推进一站式 AI 创作平台战略:视频生成与编辑仍由自研 Gen-4 和 Aleph 模型支撑;图像生成引入 Google 的 Nano Banana;音频能力则整合 ElevenLabs。体现“核心自研+关键第三方”协同路径,聚焦创作者工作流整合。
Black Forest Labs 发布 FLUX.2:新一代 AI 图像生成模型
Black Forest Labs 推出 FLUX.2 图像生成模型系列,支持最多10张参考图以保障角色与风格一致性,显著提升文本渲染、光照细节、空间逻辑及400万像素高分辨率编辑能力;含 Pro、Flex、Dev(开源320亿参数)、Klein(即将开源)四版本,兼顾质量、可控性与性价比。
Anthropic 为 Claude 开发者平台推出高级工具使用功能
Anthropic 为 Claude 开发者平台推出三项测试版工具功能:工具搜索(按需加载,降低85% Token消耗)、编程式工具调用(通过代码执行避免上下文堆积)、工具使用示例(提升调用准确性)。这些能力显著增强智能体对海量工具的动态发现、高效执行与学习能力,尤其适用于多服务器集成场景。
实测 Gemini 3 Pro Preview 构建 3D 版赛博城
实测 Gemini 3 Pro Preview 在 Google AI Studio 中,10 分钟内经 4 轮自动修正,生成可运行的 React + three.js 代码,实现百栋霓虹建筑、体积雾、动态光源与昼夜/暴雨三模式切换;结构清晰、注释完整,稳定性与响应速度较 2.5 版略有提升。
Gemini 3 全面测评
Gemini 3在数学推理、知识检索与多模态理解(图/视频)上表现顶尖,支持一键生成网站、测验、播客及自然图片编辑,研究与原型开发效率极高;但交互“情商”弱于GPT-5.1,编程生态不如Claude Sonnet 4.5成熟,API成本较高。