最新文章

最新文章

第一时间掌握 AI 行业动态与实用干货,不错过每一条值得深读的好内容。

模型的尺度之争:大而全还是小而精
AI 产品工具
2025年1月7日
0 条评论
零重力瓦力

模型的尺度之争:大而全还是小而精

大模型参数狂增却面临高成本、高能耗困境;而Molmo、Alpaca等小型模型在特定任务上反超GPT-4,兼具高效、低成本与环保优势。蒸馏技术与MoE架构正推动AI走向“适配优先”的务实路径。

#AI 模型
阅读全文
智能体构建及“人力资源平台”:Agent.ai
AI 产品工具
2025年1月6日
0 条评论
零重力瓦力

智能体构建及“人力资源平台”:Agent.ai

Agent.ai 将AI智能体类比为各有所长的“人类专家”,用户可直接调用现成智能体,也能自主创建并发布服务,构建去中心化的人力资源平台。它不替代人类,而是帮人聚焦创造性工作,推动实用、可持续的人机协作。

#智能体
阅读全文
字节跳动开源口型同步模型:LatentSync
AI 产品工具
2025年1月6日
0 条评论
零重力瓦力

字节跳动开源口型同步模型:LatentSync

字节跳动开源口型同步模型LatentSync,支持音频一键生成高自然度嘴型动画;融合Stable Diffusion提升画质,创新TREPA技术显著改善帧间连贯性,有效抑制嘴型跳变,效果媲美EMO、Vasa-1。

#视频生成#多模态
阅读全文
如何通过 Google AI Studio 快速制作手办
提示词工程
2025年1月6日
0 条评论
零重力瓦力

如何通过 Google AI Studio 快速制作手办

AIGC达人Andrew Carr用Google AI Studio免费工具链,几分钟内完成手办创作:Gemini 2.0 Flash生成概念与提示词,Imagen 3产出多角度参考图,Trellis转为GLB模型,再经ImageToStl导出STL文件,直接用于3D打印。

#Google AI Studio#3D 生成#图像生成
阅读全文
能够通过普通照片中街景自动定位实际位置的 AI 应用:Geospy
AI 产品工具
2025年1月5日
0 条评论
零重力瓦力

能够通过普通照片中街景自动定位实际位置的 AI 应用:Geospy

Geospy 是一款AI街景定位工具,上传普通照片即可自动识别拍摄地点,返回实时街景与地理信息。目前覆盖旧金山、纽约、孟菲斯、柏林、新加坡五城,适合旅行探索、地理考证与内容核查等场景。

#计算机视觉
阅读全文
开源音频生成(Text to Audio)模型:TANGOFLUX
AI 产品工具
2025年1月4日
0 条评论
零重力瓦力

开源音频生成(Text to Audio)模型:TANGOFLUX

TANGOFLUX 是一款开源可本地部署的文本生成音频模型,5.15亿参数,单块A40 GPU仅需3.7秒即可生成30秒/44.1kHz高质量音效。其创新CRPO方法能自动构建偏好数据,有效缓解TTA领域缺乏明确评价标准的难题,显著提升生成效果。

#音频生成#AI 模型
阅读全文
ZOO:解锁 AI 驱动的 CAD 设计新未来
AI 产品工具
2025年1月3日
0 条评论
零重力瓦力

ZOO:解锁 AI 驱动的 CAD 设计新未来

ZOO 推出“文生 CAD”技术,支持用自然语言直接生成参数化 CAD 模型,首次将 AIGC 能力深度引入工程设计流程。无需建模经验,工程师和设计师可通过语义指令快速构建可编辑、可复用的工业级模型,现已开放体验。

#3D 生成
阅读全文
Suno 推出音色转换功能
AI 产品工具
2025年1月3日
0 条评论
零重力瓦力

Suno 推出音色转换功能

Suno 新增音色转换功能,可在不改变主旋律的前提下,将音乐从一种音色风格迁移至另一种,例如钢琴曲一键转为管弦乐版本,原理类似图像领域的AI风格迁移。

#音频生成
阅读全文
Rodin 1.5 通过同一物体不同角度的图片生成 3D 模型
AI 产品工具
2025年1月3日
0 条评论
零重力瓦力

Rodin 1.5 通过同一物体不同角度的图片生成 3D 模型

Rodin 1.5 可基于同一物体的多角度照片生成高精度3D模型,显著提升表面细节还原度与几何准确性,适合需要快速建模的设计师和内容创作者。

#3D 生成
阅读全文
1337 篇文章,第 100 / 149