试了一下阿里通义千问 Qwen2.5-Max 的编码能力,效果相当惊艳。
提示词
请基于 Three.js 制作地月系统演示,Three.js 使用 cdn,输出一个完整的html文件
整个代码的生成过程大约 1 分多钟,一次性通过,没有任何 bug,运行效果也非常不错。代码很整洁,还提供了完整的思维链,以及代码的使用和部署方法,体验相当出色。
演示

完整代码
地月系统演示
试了一下阿里通义千问 Qwen2.5-Max 的编码能力,效果相当惊艳。
请基于 Three.js 制作地月系统演示,Three.js 使用 cdn,输出一个完整的html文件
整个代码的生成过程大约 1 分多钟,一次性通过,没有任何 bug,运行效果也非常不错。代码很整洁,还提供了完整的思维链,以及代码的使用和部署方法,体验相当出色。

地月系统演示
Mistral 推出 Medium 3.5 开源模型与 Vibe 远程代理,将编程协作从“人机同步”转向“异步委派”。128B 稠密模型以 77.6% 的 SWE-Bench 成绩超越 Claude Sonnet 4,支持自部署。Vibe 允许开发者在云端沙箱并行运行多个任务,自动提交 PR 并通知审查。配合 Le Chat 通用工作模式,该方案适合追求效率的团队及关注数据安全的独立开发者,重新定义了 AI 辅助编码的工作流。
西雅图创业公司 Logic 上线 spec 驱动 Agent 平台,用自然语言规格说明替代复杂工程。实测显示,在 IFBench 基准测试中,仅凭 500 字规范配合其自动化 harness,Gemini 3.1 Pro 性能提升 6 个百分点并登顶榜单。该平台将输入验证、契约执行等基础设施产品化,支持主流模型路由。对于正在开发 Agent 的团队,这证明优化约束描述比盲目升级模型更有效,目前已有超 250 家机构使用。
DeepSeek v4 与 GPT-5.5 发布后,本文对包括两者在内的 8 款主流模型进行前端代码生成实测。通过统一提示词开发一款适配多端的 3D 飞行避障游戏,结果显示 DeepSeek v4 与 GPT-5.5 均能一次成功运行且细节出色,但前者缺失触控支持,后者生成耗时较长;其余模型在场景设计、交互逻辑或稳定性上各有优劣。测试旨在直观对比各模型实际编码表现,开发者可访问体验网站查看具体效果。
围绕《通义千问生成 3D 地月系统模拟》展开交流,未登录用户可浏览评论,登录后可参与讨论。