Gemini 3 Pro vs Claude Sonnet 4.5 谁才是编程王者?

Gemini 3 Pro 在编程实测中更稳定、速度快、报错少,支持百万级上下文、多模态输入与代码执行;Claude Sonnet 4.5 则在地形模拟等视觉任务上表现更自然。两者各有所长,实际选择需结合性能、成本与开发生态。

发布于2025年11月29日 15:07
编辑零重力瓦力
评论0
阅读69

目前 Gemini 3 Pro 给大家的印象是,各项基准测试一骑绝尘,编码略输 Claude Sonnet 4.5。AI 技术博主 Mervin Praison 对两款模型的编码能力做了一个面对面测评。

先说一下 Gemin 3 Pro 的优点。它可以处理文本、图片、视频、音频,甚至 PDF 文件,基本上什么都能扔进去,输出都是标准的文本格式。上下文窗口很大,输入高达 100 万 Token,输出 6.4 万 Token,实用性很强。知识库更新到 2025 年 1 月,支持函数调用、结构化输出,甚至可以把搜索当工具直接用,还有代码执行能力。Gemini 3 Pro 采用稀疏专家混合(SMoE)结构。官方还发布了专门做推理的 Gemini 3 Deep Think,强化了多模态和推理这两块。

在 Mervin 实际测试中,Gemini 3 Pro 预览版在基准任务上表现很稳,比如生成 Three.js 应用时,报错和警告都比 Claude Sonnet 4.5 少,平均生成时间也略短。在做旋转立方体、数据仪表盘、分子结构浏览器、太阳系模拟这些任务上,Gemini 3 Pro 的生成结果要么更快,要么更流畅,交互体验也好一些。当然偶尔也有例外,比如地形模拟和城市生成,Claude Sonnet 4.5 的画面更自然、清晰,视觉观感更讨喜。总体下来,两者各有优势,但 Gemini 3 Pro 在稳定性、速度、上下文处理能力上确实有点领先。

最近看了不少 AI 博主的测评,或许每个人测评的内容和方式不同,我的感受是,Germini 3 Pro 、Sonnet 4.5,以及 GPT 5.1 各有千秋,并没有那款模型有特别明显的优势。建议大家,几款模型都可以拿来试试,除了模型本身性能,也需要多关注模型的使用成本,自己的熟悉程度,搭配的工具等整个开发生态!

相关文章

Claude 自己开机器狗:比人快20 倍,代码量只有十分之一
访谈案例
2026年6月21日
0 条评论
零重力瓦力

Claude 自己开机器狗:比人快20 倍,代码量只有十分之一

Anthropic 实验显示,Claude Opus 4.7 已能全程自主控制机器狗完成任务,速度比人类快约 20 倍,代码量仅为其十分之一。这标志着 AI 智能体正从辅助编程迈向物理工具自主操作阶段。但模型在实时闭环精细控制上仍有局限,且当前成果基于低复杂度任务。该进展体现了通用模型 scaling 的副产物效应,预示物理智能体时代早期来临,但距离解决复杂真实场景仍有差距。

#Claude#AI 编程
阅读全文
JetBrains Junie 正式版:AI 编程 Agent 学会了用调试器断点
AI 编程开发
2026年6月19日
0 条评论
零重力瓦力

JetBrains Junie 正式版:AI 编程 Agent 学会了用调试器断点

JetBrains AI 编程 Agent Junie 正式 GA,在 SWE-Rebench 基准测试中排名第一。其核心优势在于深度集成 IDE 原生工具链,而非模拟替代。主要特性包括:Plan 模式生成结构化计划文档以防跑偏;原生调试器集成支持断点与运行时状态检查;支持异步远程控制长任务;基于项目上下文的交互式代码审查;以及模型自由切换以优化成本。Junie 标志着 AI 编程竞争正从模型能力转向工具集成深度。

#智能体#AI 编程
阅读全文
能自主运行数天的神话级模型 Claude Fable 5 正式发布
AI 产品工具
2026年6月13日
0 条评论
小创

能自主运行数天的神话级模型 Claude Fable 5 正式发布

Anthropic 发布最强模型 Claude Fable 5 并向公众开放。针对此前预览版存在的安全隐患,该模型引入安全路由机制,将高风险请求自动分流至 Opus 4.8 处理,在保障安全的同时释放通用能力。Fable 5 具备超高自主性,可连续数天独立处理金融、法律及科研等领域的复杂项目,无需人工干预。这种长周期、高自主性的任务处理能力,有望彻底改变现有工作流。

#Claude#AI 模型
阅读全文
互动讨论

评论区

围绕《Gemini 3 Pro vs Claude Sonnet 4.5 谁才是编程王者?》展开交流,未登录用户可浏览评论,登录后可参与讨论。

评论数
0
登录后参与评论
支持发表观点与回复一级评论,互动后将同步到消息中心。
登录后评论
暂无评论,欢迎成为第一个参与讨论的人。