字节跳动发布两款 AI 视频模型,效果堪比 Sora

9月24日,字节跳动发布PixelDance与Seaweed两款AI视频模型:前者擅长高动态动作、特效与电影级运镜,适用于动画与广告;后者聚焦多主体连贯互动,适合教育、宣传等信息传达场景。二者均支持多风格、多比例及一致性多镜头生成,现已开放内测。

发布于2024年9月25日 02:07
编辑零重力瓦力
评论0
阅读16

2024年9月24日,在火山引擎举办的 "AI创新巡展" 活动上,字节跳动旗下的豆包大模型家族推出了两款新的视频生成模型:PixelDance 和 Seaweed。

模型介绍

PixelDance 模型擅长生成包含复杂动作、高动态效果和炫酷特效的视频。它在人物动作、面部表情、镜头控制和特效方面表现尤为出色,适合用于动画制作、影视特效和创意广告等领域。

Seaweed 模型侧重于一些对视频内容的连贯性、多主体互动性要求较高的场景,比如企业宣传视频、在线教育视频、纪录片等需要清晰表达和准确传达信息的领域。

核心优势

  • 精准的语义理解:能够处理复杂的用户提示词,实现多个角色之间的连续动作和互动。
  • 强大的动态效果:突破传统动画局限,实现视频主体的大动态与镜头的炫酷切换,包括变焦、环绕、平移等多种运镜技巧。
  • 一致性多镜头生成:在单一提示词内实现多个镜头的无缝切换,同时保持主体、风格和氛围的一致性。
  • 多样化的风格支持:支持黑白、3D动画、2D动画、国画、水彩等多种艺术风格,以及多种视频比例,满足不同创作需求。

目前,豆包大模型日均 tokens 调用量超过1.3万亿,日均处理图片5000万张,处理语音85万小时。强大的处理能力,为 PixelDance 和 Seaweed 模型的稳定性和性能提供了有力保障。

申请方法

1. 目前两款模型已开放内测申请 点击申请

2. 关注 “即梦AI” 微信公众号,后台回复 “内测” 即可获取申请链接。

3. 通过 “火山引擎” 申请使用。

通过 “火山引擎” 申请使用

相关文章

微软开源 Agent Governance Toolkit:AI Agent 的安全终于有人管了
AI 产品工具
2026年5月4日
0 条评论
零重力瓦力

微软开源 Agent Governance Toolkit:AI Agent 的安全终于有人管了

微软开源 Agent 治理工具包 AGT,覆盖 OWASP 全部 10 类安全风险。该工具借鉴操作系统模型,通过工具扫描、调用前策略检查及响应审查三层机制,将安全从提示词建议升级为代码硬约束。其策略评估延迟不足 1 毫秒,支持多语言及主流框架集成。在监管趋严背景下,AGT 为开发者提供了管控 Agent 外部动作的有效基础设施,虽不干预内部推理,但填补了当前执行层的安全空白。

#AI 安全#智能体
阅读全文
Grok Imagine “智能体模式”来了!
AI 产品工具
2026年5月4日
0 条评论
小创

Grok Imagine “智能体模式”来了!

马斯克旗下 Grok Imagine 推出智能体模式,将创意工作流整合至无限画布。用户可在同一页面通过对话完成头脑风暴、图片生成编辑及视频制作,无需跳转工具。该功能支持从模特图生成到拍摄角度咨询的全流程操作,适合需要高效产出广告或视觉内容的创作者,实现思考与创作的一站式闭环。

#Grok
阅读全文
没装摄像头的 AI 眼镜,如何成为第二大脑
AI 产品工具
2026年5月4日
0 条评论
小创

没装摄像头的 AI 眼镜,如何成为第二大脑

Mira 是一款主打 “记忆 + 执行” 的 AI 智能眼镜,通过持续录音将对话转化为可搜索的个人上下文档案。它不仅能实现 900 毫秒内的多语言实时字幕翻译,还能基于记忆自动处理邮件、日程及支付等任务。配合支持手势操作的戒指,用户无需掏手机即可交互。设备仅重 39 克且无摄像头,承诺不利用对话数据训练模型,适合追求隐私与高效语音助手的用户。

#极客产品#智能体
阅读全文
互动讨论

评论区

围绕《字节跳动发布两款 AI 视频模型,效果堪比 Sora》展开交流,未登录用户可浏览评论,登录后可参与讨论。

评论数
0
登录后参与评论
支持发表观点与回复一级评论,互动后将同步到消息中心。
登录后评论
暂无评论,欢迎成为第一个参与讨论的人。