Meta 发布 AI 视频、音频生成基准:Movie Gen Bench

Meta发布Movie Gen Bench,涵盖视频与音频两大评估基准:视频部分为目前最大文本转视频测试集,含超1000个多样化提示;音频部分首创支持视频→音频及文+视→音频生成,含527组真实生成样本,全部未经筛选,旨在推动AI媒体生成的公平、可复现评估。

发布于2024年10月18日 04:57
作者零重力瓦力
评论0
阅读0

Meta 发布了目前最详细的 AI 视频、音频生成基准:Meta Movie Gen Bench。

Movie Gen Video Bench(视频基准) 是迄今为止最大的文本转视频生成评估基准,汇集了超过1000个提示,涵盖了人类活动、动物、物理现象及非寻常主题等多种概念,确保在不同运动水平上实现广泛覆盖。

Movie Gen Audio Bench (音频基准)则是首个专注于视频到音频以及(文本+视频)到音频生成的基准。它包括527个生成的视频,以及相应的音效和音乐提示,展示了多样化的环境和声音效果。

为了确保评估的公平性与可比性,这些新基准包含了未经挑选的 Movie Gen 生成的视频和音频。Meta 希望通过发布这些基准,促进媒体生成研究中的公平和全面评估,从而推动该领域的更大进展。

基准的详细信息、示例视频,以及生成提示词: Movie Gen Bench

本站收录的 Meta Movie Gen 示例视频

相关文章

互动讨论

评论区

围绕《Meta 发布 AI 视频、音频生成基准:Movie Gen Bench》展开交流,未登录用户可浏览评论,登录后可参与讨论。

评论数
0
登录后参与评论
支持发表观点与回复一级评论,互动后将同步到消息中心。
登录后评论
暂无评论,欢迎成为第一个参与讨论的人。