当 Gemini 3 发布时,OpenAI 总部进入了 "红色警戒(Code Red)" 状态。但萨姆·奥特曼透露,这其实是他们的常规操作!早期的每一个行动都会比后期更有价值。DeepSeek 崛起时他们也这么干过。这种 "适度偏执" 的策略让 OpenAI 能在 6-8 周内快速响应任何威胁。奥特曼坦言:Gemini 3 并没有造成预期的冲击,但确实暴露了 OpenAI 产品的短板。奥特曼表示,他们的应对方式也很简单!疯狂发布新的功能,新图像模型、GPT-5.2、浏览器……这就是OpenAI保持领先的秘密武器。
相关文章
AI 产品工具
2026年5月22日
0 条评论
零重力瓦力
Gemini 3.5 Flash 编码实测
Gemini 3.5 Flash 在 3D 飞机避障游戏代码生成能力上较 3.1 Pro 有明显提升,飞机模型更精致、新增粒子尾焰与地面光照投影,操控手感优化。但整体效果仍不及 GPT 5.5。
#Gemini
阅读全文
AI 新闻资讯
2026年5月22日
0 条评论
小创
谷歌发布全新视频模型 Gemini Omni,视频编辑迎来质变
Google I/O 大会上,DeepMind 团队推出全新多模态视频模型 Gemini Omni,被视为视频领域的 “Nano Banana”。该模型从底层架构重新设计,支持图像、视频和音频混合输入,通过日常语言即可完成复杂视频编辑。其核心优势在于高可控性和时间维度感知,例如可让画面中的物体凭空消失或改变摄像机视角,同时保持背景与动作一致。用户仅需提供几张照片和一段语音,即可生成高度还原的个人虚拟分身。Omni 还展现出未经过专门训练的涌现能力,如自动同步视频与音乐节奏、根据剧情逻辑续写场景。
#Gemini#视频编辑#视频生成
阅读全文
访谈案例
2026年5月13日
0 条评论
小创
AI 读取梦境,离我们还有多远?
MIT 本科生 Kelly Zhang 利用 fMRI 信号实现脑内画面实时视频生成。她基于视觉皮层与深度神经网络的结构相似性,结合 Vision Transformer 提取特征、Latent Diffusion Model 还原图像及 Stable Diffusion 生成视频,成功将大脑活动转化为可视内容。该技术虽处早期且细节有待提升,但在 PTSD 治疗、失语沟通及痴呆症辅助等领域具广阔前景。其突破关键在于跨学科知识融合,打破了传统科研的领域壁垒,为未来科研方法提供了新启示。
#Ted
阅读全文
互动讨论
评论区
围绕《OpenAI 如何应对 Gemini 3 竞争威胁》展开交流,未登录用户可浏览评论,登录后可参与讨论。
评论数
0
登录后参与评论
支持发表观点与回复一级评论,互动后将同步到消息中心。
暂无评论,欢迎成为第一个参与讨论的人。