字节推出新一代视频生成模型:Goku

字节推出视频生成模型Goku及广告专用版Goku+,视频质量媲美Sora与Veo 2;Goku+支持20秒以上生成,手部动作稳定、表情生动,可实现人货互动与产品图转视频,广告制作成本降低100倍。

发布于2025年2月14日 06:07
编辑零重力瓦力
评论0
阅读34

字节推出新一代视频生成模型:Goku。除了标准的视频生成之外,还有专用于广告制作的基础模型 Goku+,视频质量十分出色,不亚于Sora 和 Veo 2。

文生视频

This close-up shot of a chameleon showcases its striking color changing capabilities. The background is blurred, drawing attention to the animal’s striking appearance.
这段特写镜头展示了一只变色龙惊人的变色能力。背景经过虚化处理,使观众的目光集中在这只动物引人注目的外观上。

横屏视频

A pig flying in the blue sky.
一只猪在蓝天中飞翔

古诗生成的视频

春花秋月何时了,往事知多少。小楼昨夜又东风,故国不堪回首月明中。
When will the spring flowers and autumn moon end? How much do we know of the lost years? Last night, the east wind again visited the small tower. I dare not look back at my old country in the moonlight.

肖像视频

The video begins with a realistic capture, transitioning from a mid-range view to a close-up as the camera zooms in from a distance and then remains focused on the subject. The main character is a charming gray squirrel perched on the trunk of a large tree. The squirrel is sitting on a branch, attentively gazing at its surroundings while slowly nibbling on food. The scene features abundantly green trees and yellow leaves, creating beautiful light and shadow effects on the ground and nearby structures. The environment is a tranquil park with ample lighting and a serene atmosphere.
视频从一个写实的画面开始,镜头从中景逐渐拉近至特写,最终聚焦在主体上。主角是一只可爱的灰色松鼠,栖息在一棵大树的树干上。它坐在树枝上,专注地观察周围环境,同时缓慢地咀嚼着食物。画面中绿树成荫,黄叶点缀,形成美丽的光影效果,映照在地面和周围的建筑物上。整个环境是一个宁静的公园,光线充足,氛围祥和。

以下视频采用了:Goku+。这款新的视频基础模型,基于 Goku,对人和产品的广告场景进行了大量优化,和传统广告制作相比,成本能够节省100倍。

Goku+:文生视频主播

能够生成超过 20 秒的视频,并展现人物稳定的手部动作以及生动的面部表情和肢体动作。

A young man dressed in a red cardigan over a white shirt, sitting in front of a festive background decorated with traditional Chinese elements such as red lanterns and decorations. The man is smiling and appears to be speaking or presenting, with an open and friendly expression. The setting suggests a celebratory or cultural theme, possibly linked to Chinese New Year.
一位年轻男子身穿红色开衫,内搭白色衬衫,坐在一个充满节日氛围的背景前。背景装饰着传统的中国元素,如红灯笼和节庆装饰。男子面带微笑,似乎正在讲话或进行演示,表情开放而友好。整个场景营造出一种庆祝或文化主题的氛围,可能与春节相关。

Goku+ 将产品图片转换为视频片段

Goku+ 实现产品与人互动

Goku+ 优化广告场景

项目地址:https://saiyan-world.github.io/goku/

相关文章

微软 Mirage:让世界模型学会“过目不忘”,速度快 10 倍、显存省 55 倍
AI 产品工具
2026年6月21日
0 条评论
零重力瓦力

微软 Mirage:让世界模型学会“过目不忘”,速度快 10 倍、显存省 55 倍

微软研究院联合多所高校发布 Mirage 模型,通过在扩散模型隐空间直接存储三维记忆,解决了 AI 视频生成中场景一致性差及计算昂贵的问题。该方案摒弃传统 RGB 点云渲染流程,使生成速度提升最高 10.57 倍,显存占用降低 55 倍,且长视频边际成本几乎不增。测试显示其三维与光度一致性优于现有方案,虽暂不支持动态物体记忆,但已开源并适用于机器人仿真等静态场景任务。

#世界模型
阅读全文
Google 搜索变身全天候智能体:Information Agents 上线,你的数据终于开始替你干活了
AI 产品工具
2026年6月15日
0 条评论
零重力瓦力

Google 搜索变身全天候智能体:Information Agents 上线,你的数据终于开始替你干活了

Google 推出 Information Agents 功能,面向 AI Ultra 订阅用户开放。该功能将搜索从被动查询转变为主动监测,智能体可 7×24 小时追踪用户需求并推送变化信息。其底层依托 Personal Intelligence 战略,通过整合 Gmail、Photos 等跨应用数据实现个性化推理。尽管存在隐私与准确性挑战,但凭借二十年数据积累,Google 正推动 AI 助手从对话工具向自主代理进化,重塑“信息找人”的交互范式。

#Google#智能体
阅读全文
Kimi Work 上线:300 个子智能体在你的电脑上同时干活,个人 Agent 之战正式开打
AI 产品工具
2026年6月14日
0 条评论
零重力瓦力

Kimi Work 上线:300 个子智能体在你的电脑上同时干活,个人 Agent 之战正式开打

6 月首周,月之暗面、微软、Google 及 Databricks 密集发布智能体产品,标志着 AI 正从对话助手转向持续行动系统。其中 Kimi Work 主打本地桌面运行,支持多智能体并行与浏览器接管;Microsoft Scout 定位永远在线的个人助理;Google 推出 24 小时信息追踪智能体;Databricks 开源 Omnigent 实现跨智能体互操作。行业共识逐渐形成,智能体将具备自主调度、任务拆解及持续运行能力。

#智能体框架#智能体
阅读全文
互动讨论

评论区

围绕《字节推出新一代视频生成模型:Goku》展开交流,未登录用户可浏览评论,登录后可参与讨论。

评论数
0
登录后参与评论
支持发表观点与回复一级评论,互动后将同步到消息中心。
登录后评论
暂无评论,欢迎成为第一个参与讨论的人。