Sora 前期测试艺术家给 OpenAI 的一封公开信:不做免费测试员
多位Sora早期测试艺术家联名致信OpenAI,抗议被当作免费测试员、公关工具和训练数据来源,直指其“艺术洗白”行为;信中呼吁尊重艺术家劳动价值,支持开源视频工具替代方案。公开信发布3小时后,OpenAI暂停所有艺术家访问权限。
Haiper 发布最新 2.1 视频模型,视频运动效果更丰富
Haiper 2.1 视频模型上线,重点优化运动表现力;启用“Smooth”模式后,主体动作更自然流畅,动态细节显著增强,适合对视频节奏与真实感有更高要求的创作者。
Gumvue AI 视频比赛
Gumvue AI 视频比赛面向AI生成视频创作者,设短片、动画、音乐视频、纪录片及实验艺术五大单元;参赛者需将作品上传YouTube并提交链接至官方页面;奖金为100/50/25美元。
PIKA 1.5 “剧情转折大赛”
Pika 1.5发起“剧情转折大赛”,征集全由其生成的创意短视频,冠军奖金3000美元,4名亚军各500美元;作品需于10月21日23:59(PST)前发布至X平台,@pika_labs并带话题#pikaplottwist。
Meta 发布 AI 视频、音频生成基准:Movie Gen Bench
Meta发布Movie Gen Bench,涵盖视频与音频两大评估基准:视频部分为目前最大文本转视频测试集,含超1000个多样化提示;音频部分首创支持视频→音频及文+视→音频生成,含527组真实生成样本,全部未经筛选,旨在推动AI媒体生成的公平、可复现评估。
能够自主导航的特斯拉 Optimus 机器人
特斯拉Optimus机器人已实现未知环境下的自主导航与避障,支持多机协同建图;仅凭单摄像头即可精准对接充电,稳定搬运11公斤负载,具备上下楼梯能力;依托统一神经网络,可实时响应安全隐患并适应多样化人机交互需求。
大语言模型看到的颜色和人类一样吗?
大语言模型并不真正“看见”颜色,而是通过词义关联理解颜色名称。AI艺术家Kat ⊷ the Poet Engineer利用维基百科的颜色名与RGB值,将颜色语义映射到三维空间,发现其分布接近人类视觉的RGB坐标——这揭示LLM对颜色的理解本质是语言关系,而非光学感知。
AI 眼镜 I-XRAY 引发隐私担忧
AI眼镜I-XRAY可实时识别人脸并从公开网络抓取住址、电话等隐私信息,技术本身并不复杂,却暴露了当前人脸识别、LLM与公共数据库结合带来的现实风险。开发者强调其初衷是警示而非滥用,并提供PimEyes等平台的信息删除指南。
两分钟讲述人类利用技术讲故事的历史
Runway发布2分钟短片,梳理从洞穴壁画、手抄本、印刷术到电影、电视、互联网及AI生成内容的叙事技术演进。视频指出,技术形态持续更迭,但人类对故事的本质渴求始终如一,也由此引出对下一代叙事方式的思考。