
现在,用 Grok 3、o1、DeepSeek 生成简单小游戏已经不足为奇,效果都还不错,难分伯仲。那么这些模型在生成复杂 3D 游戏上的表现如何呢?
AI 技术达人 Lisha,对 Grok 3、o1、Sonnet 3.5、Llama 4、DeepSeek 和 Gemini,6 款目前主流的 AI 模型进行了测试,生成一个 3D 《沙丘 x 我的世界》。
游戏生成提示词
详细评测
1. o1
兼顾了美学和功能性。游戏可玩, 画面不错,操作流畅,能成功开采香料。
游戏地址:https://play.rosebud.ai/p/3d71be95-075f-4891-9cea-b9e4824f365b
2. Grok 3
美学表现惊艳! 尤其是沙丘风格的香料采矿车,视觉效果很棒。但缺乏完整性,可自由移动,但合成系统未实现,游戏性不足。
游戏地址:https://play.rosebud.ai/p/61385e4b-0ce4-44ba-87a4-fe8be5be692d
3. Sonnet 3.5
玩法比 Grok 3 更完整,可以开采香料。但整体氛围不如 o1 和 Grok 3,缺少沉浸感。
游戏地址:https://play.rosebud.ai/p/c3aaf9bd-bbe2-48aa-9626-2280a7c25bc8
4. DeepSeek
代码成功运行,但游戏难度极高,玩家几秒内就会失败。视觉效果较差,即使尝试优化,进步有限。
游戏地址:https://play.rosebud.ai/p/2fcac7de-2820-4b09-9851-f31f0f779dad
5. Gemini 2.0 Flash 和 LLaMA 4
排名垫底,它们在第一次尝试时都未能生成可运行的代码,而其他模型都能。尝试了多次,但仍然无法成功生成符合要求的游戏。
总结
最令人印象深刻的模型是 o1、Grok 3 和 Sonnet 3.5。Grok 在美学呈现上表现最佳(甚至生成了一个非常酷的香料采矿卡车),但游戏的可玩性较差。o1 综合表现最佳,既有功能性,又有视觉吸引力。Sonnet 3.5 紧随其后,虽然具有一定可玩性,但整体氛围不如前两者。
游戏部署及测试平台:Rosebud
Rosebud 支持一键部署,并且能够对项目代码进行迭代。
评论(0)