DeepSeek 发布开源多模态模型 Janus Pro 7b,可本地部署

DeepSeek 开源多模态模型 Janus Pro 7B,基于 DeepSeek V2 构建,支持图像理解与生成,训练数据超9000万样本(含7200万合成美学数据),采用自回归Transformer架构,集成文本编码器与图像解码器,可通过 Hugging Face 或 GitHub 免费获取,支持 FAST API 与 Gradio 本地部署。

发布于2025年1月29日 07:49
编辑零重力瓦力
评论0
阅读18

国外 AI 技术达人 Mervin Praison 讲解 DeepSeek 最新开源多模态模型:Janus Pro 7B,拥有比 LLaVA 等其他开源多模态模型更加卓越的性能。

功能亮点

  1. 基于 Deep Seek V2 构建,使用超过 9000 万训练样本,以及先进的合成美学数据训练(7200 万样本),不仅能够理解图像,还能生成图像。
  2. 支持 FAST API 和 Gradio
  3. 向公众免费开放,可通过 Hugging Face 获取,附完整文档!

技术规格

  1. 自回归 Transformer 架构
  2. 拥有文本编码器、标记器、图像解码器等组件
  3. 训练数据包含:图像、字幕、表格、图表、文档分析

应用场景

  1. 详细场景描述
  2. 地标识别
  3. 文本识别
  4. 图像生成
  5. 常识问答
  6. 视觉小说创作

下载地址:https://github.com/deepseek-ai/Janus

总之,DeepSeek Janis Pro 7B 不仅提供了国外顶尖闭源多模态模型的功能,而且免费开源,相当良心!

相关文章

微软发布高速 MAI-Image-2-Efficient 企业版
AI 产品工具
2026年4月15日
0 条评论
小创

微软发布高速 MAI-Image-2-Efficient 企业版

微软发布 MAI-Image-2-Efficient 图像生成模型,主打低成本与高效率。该模型相较前代提速 22%、效率提升 4 倍,价格降幅约 41%。定位生产级应用,聚焦实时对话、短文本渲染及批处理场景,响应速度较主流竞品快 40%。借此微软形成双层产品矩阵——Efficient 版侧重成本效益,高保真版专注顶级品质,与 Azure+Foundry 平台协同布局企业 AI 生态。 Shutterstock 、 WPP 等已率先采用。

#图像生成#微软
阅读全文
【AI工具】Adobe Firefly 推出自定义图像模型功能
AI 产品工具
2026年3月26日
0 条评论
零重力瓦力

【AI工具】Adobe Firefly 推出自定义图像模型功能

Adobe Firefly上线自定义图像模型功能,用户上传10张以上图片即可训练专属艺术风格模型,聚焦AI美学方向;但该能力比Midjourney晚半年推出,AI视频部分未采用自研模型,转而接入可灵2.6,引发对其技术节奏与生态策略的质疑。

#图像生成#可灵
阅读全文
【AI工具】不是语言模型,也不是图像模型,Luma 的 UNI-1 到底是什么
AI 教程知识
2026年3月26日
0 条评论
零重力瓦力

【AI工具】不是语言模型,也不是图像模型,Luma 的 UNI-1 到底是什么

Luma 推出 UNI-1,一种突破性多模态推理模型:它并非语言或图像模型的拼接,而是将世界理解与图像生成统一于单次前向推理中,实现“先看懂、再画出”。架构上尝试融合逻辑推理与视觉想象,被称作“左右脑合一”,或预示AI建模范式的转向。

#Luma#多模态#世界模型
阅读全文
互动讨论

评论区

围绕《DeepSeek 发布开源多模态模型 Janus Pro 7b,可本地部署》展开交流,未登录用户可浏览评论,登录后可参与讨论。

评论数
0
登录后参与评论
支持发表观点与回复一级评论,互动后将同步到消息中心。
登录后评论
暂无评论,欢迎成为第一个参与讨论的人。