四部来自 Runway 官方的 Gen-4 示例短片
Runway 官方发布四部 Gen-4 短片:《孤独的小火焰》验证角色一致性,《纽约是个动物园》实现动物与实景无缝融合,《牛群》结合参考图与 Act-One 技术保障叙事连贯,《寻回》为全 AI 动画,一周内完成。展现 Gen-4 在风格统一、视觉合成与故事表达上的新能力。
Runway 发布新一代视频模型:Gen-4,实现了 "世界一致性"
Runway 发布 Gen-4 视频模型,首次实现“世界一致性”:同一角色、物体与环境可在多场景中保持视觉连贯,支持真实素材融合、精准物理模拟及跨风格创作。已向付费与企业用户开放,显著提升长视频叙事的可控性与沉浸感。
8 岁女孩 Ted 演讲:AI 时代的孩子如何学习
8岁女孩元圆在TED演讲中指出,AI可打破“练习至完美”的传统教育模式:提供即时反馈激发内驱力,适配个体节奏,将语言学习转化为文化探索。她主张用AI培养创造力与问题解决能力,而非机械记忆。
智谱发布 AutoGLM 沉思:免费、不限量,还能自己上网找资料
智谱推出免费不限量的AutoGLM沉思智能体,可自主搜索知乎、B站等14个中文平台,支持多步推理与实时操作监控;相比OpenAI和Google需付费且无法直接抓取部分中文信源的Deep Research,它更像能动手查资料、写报告的实习生。
一款开源自托管的 WhatsAPP MCP 服务器
lharries 开发的开源自托管 WhatsApp MCP 服务器,基于 whatsmeow 直连账号,所有消息与联系人本地 SQLite 存储,零云端上传。含 Go(连接层)和 Python(MCP 服务)双模块,支持 LLM 调用搜索、检索、发送等工具,可构建 AI 社交助手或跨境电商客服系统。
一款通过 AI 操作 Unreal 编写游戏的 MCP 插件
Chong-U Lim 开发的 Unreal MCP 插件基于 Model Context Protocol,支持通过 Cursor、Claude Desktop 等客户端用自然语言操控 Unreal Engine:从关卡搭建、蓝图创建到脚本编写均可一键生成,已实测用于快速开发 Flappy Bird 类游戏,大幅降低游戏开发门槛。
Tripo 开源两款前沿 3D 生成 AI 模型,重新定义高保真 3D 创作的未来
Tripo 开源两款高保真3D生成模型:TripoSG支持单图生成精细网格,融合校正流变换与几何监督VAE;TripoSF支持任意拓扑与1024³分辨率建模,首创SparseFlex稀疏表达,VAE模块同步开源。代码、权重、案例全部开放。
GPT-4o 真的成了 AI 图像编辑器
GPT-4o 不再只是对话模型,已具备图像生成、理解与交互式编辑能力,支持自然语言指令修改图片细节。其多模态“全能”特性正模糊AI工具与专业图像软件的边界,为设计师和普通用户提供更直觉的视觉创作方式。
如何通过 Freepik 轻松制作产品广告视频
只需上传20张商品实拍图,Freepik即可训练专属商品模型,自动生成广告图,并通过内置编辑器优化后一键转为动态视频,全程无需专业设计或视频技能,中小商家和营销人员可快速产出高质量广告内容。