第四天:全新的 ChatGPT Canvas
OpenAI 全新推出 ChatGPT Canvas,面向所有网页用户开放:支持左右分屏协作,浏览器内直接运行 Python(基于 WebAssembly)并输出图表;无缝接入自定义 GPT;新增段落级智能评论与修改建议,显著提升写作与编程效率。
第三天: Sora 正式发布及幕后的故事
OpenAI正式发布文生视频模型Sora,支持图生视频、视频编辑、故事板、循环生成与场景混合等能力。奥特曼强调其三大价值:赋能创作者、突破文本交互局限、推动AGI发展。目前向ChatGPT Plus/Pro用户开放,按订阅等级提供差异化生成额度。
xAI 绘画模型 Aurora 图片与提示词分享
xAI为Grok 2推出的图像生成器Aurora曾短暂上线,内容限制宽松,可生成公众人物及版权形象,但暴力内容过滤不足;擅长写实风格风景与静物,存在结构缺陷如缺手指、物体融合生硬。上线数小时后即被Flux替代。
奥特曼:2025年 AI 发展展望
奥特曼驳斥AI扩展已遇瓶颈的说法,强调“没有墙”,重申超级智能将如期到来。2025年AI发展重心转向智能体(AI Agent),具备自主规划、调用工具、长期执行复杂任务并产出实际价值的能力。OpenAI将在未来12个工作日密集展示新成果,或含Sora进展。
第二天:OpenAI 推出强化学习微调功能,让 AI 模型更懂"专业"
OpenAI 推出基于 o1 系列的强化学习微调(RFT)功能,仅需数十至千级专业数据(如罕见病病例)和自定义评分器,即可显著提升模型在医疗、法律等垂直领域的推理能力;微调后 o1-mini 致病基因预测准确率达 31%,远超基线。目前通过 Alpha 项目内测,明年初正式上线。
Runway Act One 再次升级,可将新表演映射到原视频角色
Runway Act One 新增表演映射功能:用手机拍摄的真人视频,可将表情与口型精准迁移到原视频角色上,支持真人、3D及动漫等多种类型,无需重拍、不依赖专业布光,大幅提升试演与迭代效率。
Haiper 与 VEED 合作推出 2.5 模型驱动的 API
Haiper 推出 2.5 模型驱动的视频生成 API,与月活超千万的 AI 视频编辑平台 VEED 深度集成,支持用户通过文本或图像一键生成超逼真、动作流畅的高质量视频,涵盖角色、电影场景及 B-roll 素材,现已面向全球合作伙伴开放。
Haiper.ai 推出 2.5 增强模式
Haiper.ai 上线 2.5 增强模式,支持在时间轴上精确定位关键帧图像,显著提升视频连贯性与细节表现力,让创作者对动态内容的控制更精准、更直观。
ComfyUI 现已支持 Luma 绘画模型 Photon
ComfyUI 新增支持 Luma AI 的 Photon 绘画模型,通过安装「ComfyUI-LumaAI-API」插件即可调用。支持文生图、图像/角色/风格参考及图像修改等多类工作流,适用于微距摄影、矢量插图、华丽服饰设计、动物形态转换等创意场景。