第三天： Sora 正式发布及幕后的故事

OpenAI正式发布文生视频模型Sora，支持图生视频、视频编辑、故事板、循环生成与场景混合等能力。奥特曼强调其三大价值：赋能创作者、突破文本交互局限、推动AGI发展。目前向ChatGPT Plus/Pro用户开放，按订阅等级提供差异化生成额度。

发布于2024年12月10日 13:23

编辑零重力瓦力

评论0 条

阅读37

#OpenAI #视频生成

第三天 OpenAI 正式发布了 Sora。在过去的短短 2 天里，已经有大量的创作者发布了自己用 Sora 创作的作品。有感到惊艳的，也有感到失望，觉得和可灵、Runway 差别不大的。不妨看看 Sora 开发团队对这款现象级产品的介绍，以及幕后的故事。

萨姆·奥特曼对于认为 Sora 这款产品带来了3项重要的意义

为创作者提供了强大的工具，开创 AI 与人类协作的新模式
突破纯文本交互的局限，让 AI 能够理解和生成视频内容
对实现通用人工智能（AGI）具有关键意义，有助于 AI 系统学习理解现实世界

Sora 的核心功能

文生视频：通过文字描述生成视频
图生视频：将静态图片转化为动态视频
视频编辑：包括重混（Remix）、重剪（Recut）等功能
故事板：允许用户精确控制视频序列和场景转换
创作循环视频：实现无缝循环的视频效果
场景混合：将不同视频元素智能融合（blend）

使用门槛及价格

Sora 将向 ChatGPT Plus 和 Pro 用户开放：

Plus 用户每月可获得 50 次生成机会
Pro 用户可获得 500 次快速生成权限和无限慢速生成
所有用户都可以浏览作品流获取灵感

GPT-5.6 Sol Ultra 1 小时证明 60 年未解的图论猜想

OpenAI 旗下 GPT-5.6 Sol Ultra 通过 64 路并行 agent 在 1 小时内生成了图论 CDC 猜想的证明文本，成本不足 500 美元。该成果引发争议，因缺乏 Lean 机械化验证、未公开完整推理轨迹及受限于图论形式化库不成熟，数学界对其有效性存疑。此事表明 LLM 已具备启发式数学搜索能力，但验证基础设施滞后仍是瓶颈。未来“多路并行+防放弃 prompt”或成范式，而完善 Lean 工具链是确立 AI 证明可信度的关键。

如何用 AI 零门槛复刻月入万刀的无人出镜频道

AI 博主 ADIL 演示利用 Claude Fable 5 配合 Higgsfield MCP 插件，在 20 分钟内全自动复刻高收益 YouTube 频道。该工作流集成图像、视频及语音生成引擎，可自动分析爆款结构、撰写脚本并一键产出含配音的纪录片视频及封面标签。平台并不排斥优质 AI 内容，此端到端自动化流程将创作耗时从数天缩至十几分钟，大幅降低不露脸创作门槛。未来核心竞争力在于利用工具实现规模化生产与持续运营的能力。

Google 为何要开发 Gemma 4 模型

谷歌推出开源模型 Gemma 4，旨在解决网络受限地区无法使用前沿 AI 的问题。该模型追求内存占用下的智能最大化，首次具备多模态与智能体能力，支持在无网移动端高效运行复杂任务。目前已在乌干达离线医疗系统及秘鲁原住民语言保护等场景中落地应用。通过将大模型蒸馏至终端设备，Gemma 4 摆脱了对云端算力的依赖，推动去中心化开源生态发展，赋能各社区按需构建专属系统。

#开源模型#Google#Gemma

阅读全文

互动讨论

评论区

围绕《第三天： Sora 正式发布及幕后的故事》展开交流，未登录用户可浏览评论，登录后可参与讨论。

评论数

登录后参与评论

支持发表观点与回复一级评论，互动后将同步到消息中心。

登录后评论

暂无评论，欢迎成为第一个参与讨论的人。

第三天： Sora 正式发布及幕后的故事

萨姆·奥特曼对于认为 Sora 这款产品带来了3项重要的意义

Sora 的核心功能

使用门槛及价格

相关文章

GPT-5.6 Sol Ultra 1 小时证明 60 年未解的图论猜想

如何用 AI 零门槛复刻月入万刀的无人出镜频道

Google 为何要开发 Gemma 4 模型

评论区