Midjourney 发布全能参考系统技术:Omni-Reference

Midjourney V7 推出 Omni-Reference 全能参考系统,支持将任意图像中的角色、物体、载具等元素精准复现到新图中。通过网页拖拽或 Discord 的 `--oref` 与 `--ow` 参数(0–1000)调节参考强度,可灵活平衡风格迁移与高保真还原,目前处于实验阶段。

发布于2025年5月2日 07:47
编辑零重力瓦力
评论0
阅读90

Midjourney 发布了一项全新的图像参考系统,名为 Omni-Reference(全能参考)。这个系统不仅能复现 V6 版本中的 “角色参考” 功能,还拥有更强大、更灵活的表现力。

Midjourney 发布全能参考系统技术:Omni-Reference

什么是全能参考(Omni-Reference)

Omni-Reference 可以被理解为一种“把这个元素放进我的图片里” 的系统。它不仅适用于角色,还能用于物体、载具、非人类生物等各种元素。

如何使用 Omni-Reference

网页版

  1. 在设置菜单中将模型版本升级到 V7。
  2. 将图像拖入提示栏,并放入标有 “Omni-reference” 的区域。
  3. 使用滑块调节参考强度。

Discord

  1. 使用  --oref url  参数,url 指向你要参考的图片。
  2. 通过  --ow(omni-weight) 参数控制参考强度。

关于全能参考的权重

--ow(omni-weight)参数可调节模型对参考图像的依赖程度。数值范围为 0 到 1000,默认值为 100。如果你想改变图像风格(例如从照片转为动漫),应降低权重(如:--ow 25)。如果你希望角色面部特征或服饰高度还原,应提高权重(如:--ow 400)。

--stylize--exp 参数会与 omni-reference 竞争对图像的影响力。如果 stylize 或 exp 很高,建议相应提高 omni-weight,例如:–stylize 1000 –-ow 400 --exp 100 –-oref person.png

注意:如非极高的 stylize 和 exp,通常不建议 --ow 超过 400,否则效果可能适得其反。

Omni-Reference 的更多用法

支持与个性化、生动化(stylization)、风格参考、情绪板(moodboards)等功能协同使用。

如果你希望角色持剑,应在 prompt 明确描述,例如:a character holding a sword –-oref sword.png

Midjourney 发布全能参考系统技术:Omni-Reference

若想实现风格迁移且权重较低,应在 prompt 中详细描述角色需要保留的特征,例如:an anime woman with blonde hair and red suspenders --oref url –-ow 25

Midjourney 发布全能参考系统技术:Omni-Reference

全能参考目前尚属尝试阶段,但如果 omni-reference 图像中有两个角色(同图或并排两个图),且 prompt 中有对应描述,往往能在生成图像中同时出现这两位角色。

相关文章

一段代码让网站出海,这个 AI 翻译工具把多语言 SEO 玩明白了
AI 产品工具
2026年6月1日
0 条评论
小创

一段代码让网站出海,这个 AI 翻译工具把多语言 SEO 玩明白了

跨境电商网站常因语言壁垒导致高跳出率。Weglot 是一款 AI 翻译工具,仅需几分钟即可通过添加脚本实现网站多语言本地化,且保持原有排版。该工具支持可视化编辑、术语表锁定及团队协作,便于后续维护。同时,它能自动优化 hreflang 标签、独立 URL 及元数据,解决多语言 SEO 难题。借助母语内容布局小语种市场,企业可以低成本获取流量红利,有效提升海外转化率。

阅读全文
SCOPE 给 AI 绘画装上了 “语义追踪器”,复杂提示词终于不用反复抽卡了
AI 产品工具
2026年6月1日
0 条评论
零重力瓦力

SCOPE 给 AI 绘画装上了 “语义追踪器”,复杂提示词终于不用反复抽卡了

中科大团队发布 SCOPE 框架,通过结构化语义规格解决 AI 绘画中复杂提示词语义丢失问题。该系统将提示词拆解为实体、约束及未知项,构建包含分解、合成、生成、验证的四步循环,并辅以检索、推理和修复技能,实现生成过程全程可追溯与精准修复。团队还推出 Gen-Arena 评测基准及 EGIP 指标。实验显示 SCOPE 在多项基准中表现优异,为多元素控制场景提供了工程化解决方案,代码已开源。

#AI 绘画
阅读全文
Stable Audio 3.0 发布:开源音频生成从 11 秒走到 6 分钟
AI 产品工具
2026年5月28日
0 条评论
零重力瓦力

Stable Audio 3.0 发布:开源音频生成从 11 秒走到 6 分钟

Stability AI 发布开源音频模型 Stable Audio 3.0,最长可生成 6 分 20 秒立体声音频。该模型采用 SAME 架构实现 4096 倍压缩,支持变量长度生成与局部编辑,Small 版本可在移动端离线运行。训练数据均获授权,规避版权风险。提供四个变体及 LoRA 微调文档,社区许可允许商用。此次升级标志着开源音频生成从短音效迈向完整歌曲创作,为开发者提供了本地化、合规的高质量音频生成方案。

#开源模型#AI 音乐
阅读全文
互动讨论

评论区

围绕《Midjourney 发布全能参考系统技术:Omni-Reference》展开交流,未登录用户可浏览评论,登录后可参与讨论。

评论数
0
登录后参与评论
支持发表观点与回复一级评论,互动后将同步到消息中心。
登录后评论
暂无评论,欢迎成为第一个参与讨论的人。