上海人工智能实验室开发的一款文字转换3D模型,能够在5分钟内生成高质量的 3D 物体。
生成过程分两步:
- 模型从已有的 3D 数据中学习,通过扩散模型,快速生成粗略的3D模型。这一步主要是为了快速制作原型。
- 利用 2D 图像的扩散模型,进一步改善第一步生成的 3D 模型纹理,使其看起来更真实。这一步包括对模型的细节进行优化。
为了训练这个模型,技术团队清理并标注了一个 大规模的开源3D数据集,并结合了视觉语言模型和大型语言模型的技术。模型和代码可公开获取。
论文地址
项目地址
上海人工智能实验室推出3DTopia,支持文生3D,5分钟内生成高质量物体模型。采用两阶段扩散架构:先基于3D数据生成几何粗模,再用2D图像扩散模型优化纹理与细节。依托自建清洗标注的大规模开源3D数据集,融合视觉语言与大语言模型能力,模型与代码已开源。
上海人工智能实验室开发的一款文字转换3D模型,能够在5分钟内生成高质量的 3D 物体。
生成过程分两步:
为了训练这个模型,技术团队清理并标注了一个 大规模的开源3D数据集,并结合了视觉语言模型和大型语言模型的技术。模型和代码可公开获取。
论文地址
项目地址
硅谷 AI 独角兽 Genspark 发布 Workspace 4.0,核心升级 Claw 功能专为创作者打造。它能自动化处理调研、邮件、PPT 等跨步骤杂活,并支持串联跨应用重复操作。新增 Clip Genius、AI Designer 及故事板生成工具,可自动提取视频信息、产出品牌素材与分镜脚本。配合 AI Developer,用户仅需自然语言描述即可搭建网站。该工具旨在让创作者从繁琐幕后工作中解放,专注于结果把控。

xAI 将于下周发布 Grok Build 和 Grok CLI ,正式进军智能体编程赛道,与 Claude Code 、 OpenAI Codex 等竞争。 Grok 4.3 已向订阅用户开放测试。产品采用本地与远程双轨设计,亮点是 Arena 模式,让多个智能体同场竞争,用户直接挑选最佳结果。此外还有 Grok Computer 桌面客户端和第三方服务连接器生态布局,差异化竞争策略明确。

Anthropic 推出 Claude Design ,用户通过自然语言描述即可生成原型图、幻灯片等视觉内容,面向缺乏设计背景的创业者和产品经理。该产品定位为与 Canva 互补而非竞争,支持导出多种格式并可导入 Canva 进行精修。企业用户还能利用品牌一致性功能,保持统一的视觉风格。此举被视为 Anthropic 深化企业市场的重要举措,估值或达 8000 亿美元。
围绕《文字转 3D 模型 3DTopia,能够在 5 分钟内生成高质量 3D 物体》展开交流,未登录用户可浏览评论,登录后可参与讨论。