NEX 的 Ikon 2 AI 绘画模型击败 Dall·E 3、Flux 等巨头,问鼎 GenEval 排行榜!

NEX 六人团队研发的 Ikon 2 AI 绘画模型,仅用 9 万 GPU 小时、1/6 行业预算,在 GenEval 提示匹配度评测中力压 DALL·E 3、Flux 和 DeepSeek Janus 登顶榜首,以极低成本实现高精度图像生成。

发布于2025年3月8日 04:06
编辑零重力瓦力
评论0
阅读66

NEX 的 Ikon 2 AI 绘画模型击败 Dall·E 3、Flux 等巨头,问鼎 GenEval 排行榜!

NEX 推出新的 AI 绘画模型 Ikon 2,在评估提示词与画面匹配度的基准测试 GenEval Overall Score 中,超越 Dall·E 3、Flux、DeepSeek Janus,拔得头筹。

NEX 的 Ikon 2 AI 绘画模型击败 Dall·E 3、Flux 等巨头,问鼎 GenEval 排行榜!

打造 Ikon 模型的团队仅有 6 人,预算是其他同类模型的 1/6,模型训练也只花费了 9 万 GPU 小时,比其他 AI 绘画模型少的多。

Ikon 2 和 Flux 生成图像对比

NEX 的 Ikon 2 AI 绘画模型击败 Dall·E 3、Flux 等巨头,问鼎 GenEval 排行榜!

three pizzas on a wooden table

NEX 的 Ikon 2 AI 绘画模型击败 Dall·E 3、Flux 等巨头,问鼎 GenEval 排行榜!

four zebras in the wild

NEX 的 Ikon 2 AI 绘画模型击败 Dall·E 3、Flux 等巨头,问鼎 GenEval 排行榜!

Fashion model with clothes in hand

NEX 访问地址:https://www.nex.art/

相关文章

拜耳用 3 层反思循环把 AI 拉进制药生产线:上下文工程和 harness 工程到底在干什么
智能体工程
2026年6月21日
0 条评论
零重力瓦力

拜耳用 3 层反思循环把 AI 拉进制药生产线:上下文工程和 harness 工程到底在干什么

拜耳制药和 Thoughtworks 在 Martin Fowler 的博客上发表了一篇完整案例,讲他们花了两年多时间把 PRINCE(Preclinical Information Center)从关键词搜索工具演变成多智能体 RAG 系

#智能体工程
阅读全文
Vercel 发布 eve 开源智能体框架:Agent 界的 Next.js 终于来了
智能体工程
2026年6月18日
0 条评论
零重力瓦力

Vercel 发布 eve 开源智能体框架:Agent 界的 Next.js 终于来了

Vercel 发布开源智能体框架 eve,采用文件系统优先设计,将 Agent 定义为目录结构以降低理解成本。框架内置持久化会话、沙盒计算、人类审批、安全连接、多渠道部署及可观测性六大生产级能力,解决重复造轮子痛点。eve 目前处于公开预览阶段,框架免费但托管服务收费。该框架标志着 AI Agent 开发正从混乱走向标准化,大幅缩短从 demo 到上线的距离,但需注意 beta 阶段的 API 变动及供应商锁定风险。

#智能体框架#智能体工程
阅读全文
谷歌说 AI 不该假装确定:忠实不确定性如何终结幻觉困局
智能体工程
2026年6月13日
0 条评论
零重力瓦力

谷歌说 AI 不该假装确定:忠实不确定性如何终结幻觉困局

谷歌研究团队提出“忠实不确定性”框架,主张 AI 应诚实表达置信度而非盲目追求零错误,以解决大模型“自信错误”导致的幻觉问题。该研究指出传统降幻觉方法存在高昂“效用税”,建议将输出区分为自信错误与诚实猜测。这对 AI Agent 尤为关键,能优化元认知判断与工具调用效率。开发者可通过调整评估指标、提示词及路由策略落地应用,推动系统从可用迈向可靠。

#Google#智能体工程
阅读全文
互动讨论

评论区

围绕《NEX 的 Ikon 2 AI 绘画模型击败 Dall·E 3、Flux 等巨头,问鼎 GenEval 排行榜!》展开交流,未登录用户可浏览评论,登录后可参与讨论。

评论数
0
登录后参与评论
支持发表观点与回复一级评论,互动后将同步到消息中心。
登录后评论
暂无评论,欢迎成为第一个参与讨论的人。