Haiper 发布 2.0 可以制作 30 秒 4K 高清视频
Haiper 2.0上线,支持生成最长30秒、4K分辨率60FPS的高清视频;新增舞蹈、人像、梗图等垂直场景模板,并在生成过程中集成背景去除、光线优化与镜头调整等精细化控制能力。
Runway 面部表情捕捉 Act-One 使用教程
Runway新推Act-One面部表情捕捉工具,上传一段带丰富表情的自拍视频+一张人物参考图,即可自动生成高还原度、富有表现力的驱动视频,操作极简,适合数字人动画快速制作。
Runway Act-One 和 可灵 + LivePortrait 方案对比
Runway Act-One 仅支持面部表情迁移,无法处理肢体动作与环境变化;而可灵+LivePortrait(免费)方案在非特写镜头中泛化能力更强,能更好应对多角度、多场景的视频驱动需求,实用性更优。
结合目前主流的绘画模型的设计工具:Gamma
Gamma 新增集成 Flux Pro 1.1、Imagen 3、Ideogram 2 和 DALL·E 3 等主流 AI 绘画模型,让网站与 PPT 制作用户可直接调用多种图像生成能力。这标志着生成式 AI 正加速从底层技术走向设计类工具的深度实用化。
Midjouney 纹理重绘结合可灵制作创意视频
Midjourney纹理重绘可在保持主体轮廓前提下替换表面质感,配合可灵生成首尾帧过渡视频。四组案例展示墨线成花、手掌化岛、立方体融为巧克力蛋糕、战士蜕变为青铜雕像,全程依赖精准提示词实现形态与材质的诗意转化。
Framer:可设置运动轨迹的视频插帧技术
Framer是一款交互式视频插帧工具,支持手动设置关键点运动轨迹,精准控制两帧间的局部形变与过渡;也提供“自动驾驶”模式自动估计关键点并优化轨迹。适用于图像变形、延时摄影、卡通插值等场景,兼顾创意控制与使用便捷性。
微软发布最新用户界面解析模型:OmniParser
微软推出OmniParser,可将UI截图精准解析为结构化元素,显著提升GPT-4V等视觉语言模型对界面组件、图标功能及可交互区域的理解能力;基于6.7万截图与7000图标描述对训练,在SeeClick等基准测试中超越GPT-4V基线,亦可作为插件增强Phi-3.5-V、Llama-3.2-V等模型的UI理解性能。
100% AI 生成 Dior 广告片
Dior这支广告片全程由AI生成,从人物、场景、产品到配音、配乐无一例外,使用Midjourney、Gen-3 Alpha Turbo、Udio等工具协同完成。它并非概念演示,而是具备商业级完成度的实拍替代方案,标志着AI已能独立承担高端品牌视频创作全流程。
AI 科幻概念短片《黑暗星球:殖民地》
AI科幻短片《黑暗星球:殖民地》由ZOOT与海螺AI联合打造,以冷峻写实的视觉风格呈现外星殖民地的生存图景,融合AI生成影像与硬核科幻叙事,探讨人类在极端环境下的伦理抉择与文明存续。