#视频生成
国产开源 AI 视频生成模型:跃问(Step-Video-T2V)
国产开源视频生成模型“跃问(Step-Video-T2V)”参数达300亿,支持中英文输入,可生成最长204帧高清视频;自研Video-VAE实现时空高效压缩,结合3D全注意力DiT与流匹配去噪,并通过Video-DPO优化真实感。模型已开源,官网与GitHub免费获取。
RenderNet 推出一键换衣功能
RenderNet上线一键换衣功能:上传上衣与下装图片,即可为固定虚拟模特生成自然流畅的换装动态视频,显著提升虚拟网红内容的制作效率与真实感。
Pika 情人节推出新特效,自拍照瞬间成动态表情包
Pika 情人节上线新特效,上传自拍照即可自动生成趣味动态表情包,支持一键导出 GIF,操作简单,适合社交分享与节日互动。
字节推出新一代视频生成模型:Goku
字节推出视频生成模型Goku及广告专用版Goku+,视频质量媲美Sora与Veo 2;Goku+支持20秒以上生成,手部动作稳定、表情生动,可实现人货互动与产品图转视频,广告制作成本降低100倍。
AI 动画短片《匚尺丨ㄒㄒ乇尺乙》
Native Foreign工作室用Sora逐帧重制获奖动画《匚尺丨ㄒㄒ乇尺乙》(Critterz),小生物主动打破第四面墙,调侃纪录片商业化逻辑;左为一年前DALL·E 2版,右为Sora新版,直观呈现AI动画技术进步。
Magic 1-For-1:一分钟生成高质量视频,速度快到超乎想象
Magic 1-For-1 是一款开源视频生成模型,采用“文本→图像→视频”两阶段策略,兼顾生成质量与效率;3秒可出5秒视频,1分钟内完成1分钟高清视频生成,依托多模态融合、对抗性蒸馏和参数稀疏化等优化,显著降低显存与计算开销。
Meta 推出新的 AI 视频生成模型:VideoJAM,运动表现超越 Sora
Meta发布VideoJAM,专攻运动连贯性,动作自然度超越Sora。它联合学习画面与动作,通过Inner-Guidance机制动态优化生成方向,无需额外数据或模型改造,即可提升舞蹈、运动及慢动作等场景的真实感,兼容多种视频生成框架。
字节跳动推出新一代人像 AI 视频生成模型:OmniHuman-1
字节跳动推出OmniHuman-1人像视频生成模型,仅需单张人像图+音频/视频/混合信号即可驱动生成高保真动态视频。突破弱音频信号下生成瓶颈,支持任意比例输入与身体部位精准控制,适配唱歌、讲话、竖屏等多场景。
九大 AI 视频模型对比:林中白虎
AIGC达人Heather Cooper用“林中白虎”统一提示词,实测Google Veo 2、Sora、腾讯混元等九大AI视频模型。聚焦生成质量、镜头语言与氛围表现力,直观呈现当前文生视频技术的多强格局与差异化能力。