NEX 的 Ikon 2 AI 绘画模型击败 Dall·E 3、Flux 等巨头，问鼎 GenEval 排行榜！

NEX 六人团队研发的 Ikon 2 AI 绘画模型，仅用 9 万 GPU 小时、1/6 行业预算，在 GenEval 提示匹配度评测中力压 DALL·E 3、Flux 和 DeepSeek Janus 登顶榜首，以极低成本实现高精度图像生成。

发布于2025年3月8日 04:06

编辑零重力瓦力

评论0 条

阅读72

#图像生成

NEX 推出新的 AI 绘画模型 Ikon 2，在评估提示词与画面匹配度的基准测试 GenEval Overall Score 中，超越 Dall·E 3、Flux、DeepSeek Janus，拔得头筹。

打造 Ikon 模型的团队仅有 6 人，预算是其他同类模型的 1/6，模型训练也只花费了 9 万 GPU 小时，比其他 AI 绘画模型少的多。

Ikon 2 和 Flux 生成图像对比

three pizzas on a wooden table

four zebras in the wild

Fashion model with clothes in hand

NEX 访问地址：https://www.nex.art/

Ploy 从 Claude Opus 4.8 迁移到 GPT-5.6 完整实录

Ploy 公司将 AI agent 从 Claude Opus 4.8 迁移至 GPT-5.6 Sol 后，构建耗时缩短过半且成本降低，但过程中遭遇三大工程挑战。一是评测框架适配旧模型导致误判；二是新模型填充冗余参数引发工具调用异常，需通过 schema 变换解决；三是缓存机制差异致命中率归零，需重构 key 策略。这表明生产环境模型迁移并非简单替换，需针对调用习惯与基础设施进行深度工程适配。

#智能体工程#ChatGPT#Claude

AI 工程的 4 步进化：每一步都站在上一步肩上

AI 工程化演进并非替代而是叠加，包含四个关键维度：Prompt engineering 解决单次输出准确性；Context engineering 通过 RAG 等技术优化信息输入；Harness 赋予模型工具与环境以具备行动能力；Loop 则通过迭代验证提升多步执行稳定性。这四个阶段分别对应模型的表达、记忆、手脚与工程纪律，缺一不可。成熟的 AI 产品需同时整合这四层能力，当前行业仍在探索如何平衡 Loop 的自动化与人工验证机制。

GLM 5.2 裸跑击败 Claude Code：Semgrep 安全基准实验里的意外结果

Semgrep 实验显示，开源模型 GLM 5.2 在无脚手架辅助下，IDOR 漏洞检测 F1 达 39%，超越 Claude Code 且单漏洞成本仅 0.17 美元。该模型采用 MoE 架构与 MIT 许可，编码能力接近闭源前沿水平。结果表明模型推理能力提升正缩小脚手架红利，低成本优势或改变安全审计部署策略。尽管结论受限于特定任务，但证实开源模型在安全领域已具备实战竞争力，值得纳入候选池测试。

#GLM#AI 安全

阅读全文

互动讨论

评论区

围绕《NEX 的 Ikon 2 AI 绘画模型击败 Dall·E 3、Flux 等巨头，问鼎 GenEval 排行榜！》展开交流，未登录用户可浏览评论，登录后可参与讨论。

评论数

登录后参与评论

支持发表观点与回复一级评论，互动后将同步到消息中心。

登录后评论

暂无评论，欢迎成为第一个参与讨论的人。

NEX 的 Ikon 2 AI 绘画模型击败 Dall·E 3、Flux 等巨头，问鼎 GenEval 排行榜！

Ikon 2 和 Flux 生成图像对比

相关文章

Ploy 从 Claude Opus 4.8 迁移到 GPT-5.6 完整实录

AI 工程的 4 步进化：每一步都站在上一步肩上

GLM 5.2 裸跑击败 Claude Code：Semgrep 安全基准实验里的意外结果

评论区