Meta 发布了目前最详细的 AI 视频、音频生成基准:Meta Movie Gen Bench。

Movie Gen Video Bench(视频基准) 是迄今为止最大的文本转视频生成评估基准,汇集了超过1000个提示,涵盖了人类活动、动物、物理现象及非寻常主题等多种概念,确保在不同运动水平上实现广泛覆盖。

Movie Gen Audio Bench (音频基准)则是首个专注于视频到音频以及(文本+视频)到音频生成的基准。它包括527个生成的视频,以及相应的音效和音乐提示,展示了多样化的环境和声音效果。

为了确保评估的公平性与可比性,这些新基准包含了未经挑选的 Movie Gen 生成的视频和音频。Meta 希望通过发布这些基准,促进媒体生成研究中的公平和全面评估,从而推动该领域的更大进展。

基准的详细信息、示例视频,以及生成提示词: Movie Gen Bench

本站收录的 Meta Movie Gen 示例视频