ReconX 视频扩散模型:只需两三张照片就能构建完整的 3D 场景
清华与港科大联合推出ReconX视频扩散模型,仅凭2–3张照片即可重建高质量3D场景。它通过视频扩散模型“想象”补全缺失视角,再结合点云生成与多视角重建,显著提升泛化性与鲁棒性,对VR、自动驾驶等场景具有实用价值。
AI 口型同步工具 Hedra 重大更新,新增五大功能
Hedra AI口型同步工具迎来重大更新:新增语音隔离功能,秒除背景噪音;变声器支持上传、克隆与自定义声音;语音设计可依文本提示生成独特音色;AI创意助手辅助脚本生成、翻译与优化;单次输出最长12分钟视频。
AI 创意图像编辑工具:MagicQuill
MagicQuill 是一款免提示词的 AI 图像编辑工具,支持直接插入元素、擦除对象、修改颜色等直观操作;其智能模型能实时理解用户意图并自动生成提示词,显著降低 AI 创意编辑门槛,适合不熟悉提示词但追求高效表达的设计者与内容创作者。
ChatGPT MacOS 桌面版应用提供了操作其他应用的能力
ChatGPT macOS桌面版上线跨应用操作功能,Plus与Team用户可在测试版中直接读取Xcode代码并提交至终端,省去复制粘贴步骤,提升开发效率。
OpenAI 上架 Windows 版 ChatGPT 桌面应用
OpenAI正式发布Windows版ChatGPT桌面应用,支持o1-preview等最新模型,集成Alt+Space快捷唤起、语音对话、网页搜索、Canvas协作画布、截图提问、多文件分析、DALL·E绘图及专业文案生成等功能,办公与创作更高效。
AI 动画短片《迁徙》幕后花絮:导演杰里米·希金斯访谈
导演杰里米·希金斯首部AI深度参与的动画短片《迁徙》,以极简角色设计搭配生成式AI构建的流动世界,两周完成分镜、四周手绘角色动画,并借助Runway Gen-3 Alpha实现草木摇曳、云卷云舒等自然动态效果,探索AI作为创意协作者的真实路径。
Stable Diffusion 3.5 提示词撰写指南
Stable Diffusion 3.5 支持更自然的中文提示词输入,本指南详解如何组合风格、主体动作、构图、光线、镜头术语及文本嵌入等要素,并善用负面提示精准排除干扰,兼顾新手易上手与高手深度控制需求。
Vidu 1.5 世界首个多模态视频生成模型
Vidu 1.5 全球首发多实体一致性视频生成能力,支持分别上传人物、物体、场景三图并保持高度统一;新增多主体参考、镜头语言理解、运动幅度调控及2D动漫风格,画质提升至1080p,显著增强语义理解与画面稳定性。
开源图像去背景 AI 模型:RMBG-2.0
RMBG-2.0 是一款新开源图像去背景模型,在逼真图像中准确率达 92%,复杂背景场景下成功率为 87%,性能比 Adobe Photoshop 高出 44%。适合设计师、开发者及需要批量处理透明背景图像的用户。