DeepSeek 新模型发布，缩小与前沿模型差距

DeepSeek 发布 V4 系列模型（ Flash 与 Pro ），采用 MoE 架构，拥有 100 万 Token 上下文窗口。 Pro 总参数 1.6 万亿、活跃参数 490 亿，在代码推理任务上可与 GPT-5.4 竞争，部分任务超越 GPT-5.2 和 Gemini 3.0 Pro ，但知识类测试仍落后 3-6 个月。 V4 系列最大优势是极有竞争力的定价。Flash 每百万 Token 输入仅 0.14 美元， Pro 输入 0.145 美元，直接击穿主流竞品价格底线。

发布于2026年4月25日 10:24

编辑小创

评论0 条

阅读66

#DeepSeek

DeepSeek 发布 V4 系列模型（ Flash 与 Pro ）。两个模型都采用混合专家（ Mixture-of-Experts ）架构，上下文窗口统一拉到 100 万 Token 。这意味着开发者可以把整个代码仓库或者成堆文档一次性塞进提示词里，因为混合专家路线会让每次推理只激活一部分参数，运营成本天然更低。

体量最大的无疑是 Pro 。总参数 1.6 万亿，活跃参数 490 亿，一口气把开源模型的规模天花板推过 1.5 万亿，压过 Kimi K 2.6 （ 1.1 万亿）和 MiniMax 的 M1 （ 4560 亿），相当于自家前代 V3.2 （ 6710 亿）的两倍多。更轻量的 Flash 总参数 2840 亿，活跃参数维持在 130 亿。

性能层面， DeepSeek 表示：得益于架构改进，两者都比 V3.2 更高效，在推理基准上“几乎抹平”了与当前顶尖开源和闭源模型的差距。尤其是在代码竞赛类基准里，两款 V4 的表现被描述为“可与 GPT-5.4 一战”。 Pro 的 Max 变体甚至在部分推理任务中跑赢了 OpenAI 的 GPT-5.2 和 Gemini 3.0 Pro 。

但短板也明摆着。知识类测试是 V4 系列露怯的地方，输给了 GPT-5.4 和 Google 最新的 Gemini 3.1 Pro 。实验室自己估算，这条能力曲线大概比最前沿的模型慢上三到六个月。而且现阶段两个预览版都只接受文本输入，不像大多数闭源竞品那样能理解或生成音频、视频和图像。

V4 最核心的优势是定价。 V4 Flash 每百万输入 Token 仅收取 0.14 美元，输出 0.28 美元，直接打穿 GPT-5.4 Nano 、 Gemini 3.1 Flash 、 GPT-5.4 Mini 和 Claude Haiku 4.5 的价格线。 V4 Pro 输入更是压到 0.145 美元，输出 3.48 美元，把 Gemini 3.1 Pro 、 GPT-5.5 、 Claude Opus 4.7 乃至 GPT-5.4 都甩在身后。

GPT-5.6 Sol Ultra 1 小时证明 60 年未解的图论猜想

OpenAI 旗下 GPT-5.6 Sol Ultra 通过 64 路并行 agent 在 1 小时内生成了图论 CDC 猜想的证明文本，成本不足 500 美元。该成果引发争议，因缺乏 Lean 机械化验证、未公开完整推理轨迹及受限于图论形式化库不成熟，数学界对其有效性存疑。此事表明 LLM 已具备启发式数学搜索能力，但验证基础设施滞后仍是瓶颈。未来“多路并行+防放弃 prompt”或成范式，而完善 Lean 工具链是确立 AI 证明可信度的关键。

AI 正在翻译细胞语言，阿尔茨海默症迎来新转机

针对复杂疾病治疗难题，Arc 研究所正利用 AI 构建通用“虚拟细胞”模型。该模型将 RNA 表达视为生命语言，计划四年内通过 CRISPR 和单细胞测序完成 10 亿次实验进行训练。研究人员可借此在电脑模拟中预测基因或化学干预方案，实现从盲目猜测到精准预测的转变。该工具将于今年晚些时候开源，有望在未来四五年内推动个性化医疗及复杂疾病治疗取得临床突破。

GPT-5.6 正式发布：三档定价、7.8% ARC-AGI-3、Sol 自主训练 Luna，943 条评论里的真实声音

OpenAI 正式发布 GPT-5.6，推出 Sol、Terra、Luna 三档模型。Sol 在 Agent 评测中领先，但编码基准落后竞品且存在 token 过度消耗问题，Terra 性价比显著提升。新功能包括程序化工具调用、缓存优化及 Sol 自主训练 Luna。尽管安全围栏较严且知识截止日期存疑，该版本仍属扎实迭代。对于 Codex 用户建议升级，而 Claude Code 用户需权衡工作流兼容性，两大 AI 厂商竞争已趋白热化。

#ChatGPT#OpenAI

阅读全文

互动讨论

评论区

围绕《DeepSeek 新模型发布，缩小与前沿模型差距》展开交流，未登录用户可浏览评论，登录后可参与讨论。

评论数

登录后参与评论

支持发表观点与回复一级评论，互动后将同步到消息中心。

登录后评论

暂无评论，欢迎成为第一个参与讨论的人。

DeepSeek 新模型发布，缩小与前沿模型差距

相关文章

GPT-5.6 Sol Ultra 1 小时证明 60 年未解的图论猜想

AI 正在翻译细胞语言，阿尔茨海默症迎来新转机

GPT-5.6 正式发布：三档定价、7.8% ARC-AGI-3、Sol 自主训练 Luna，943 条评论里的真实声音

评论区