DeepSeek 发布开源多模态模型 Janus Pro 7b,可本地部署

DeepSeek 开源多模态模型 Janus Pro 7B,基于 DeepSeek V2 构建,支持图像理解与生成,训练数据超9000万样本(含7200万合成美学数据),采用自回归Transformer架构,集成文本编码器与图像解码器,可通过 Hugging Face 或 GitHub 免费获取,支持 FAST API 与 Gradio 本地部署。

发布于2025年1月29日 07:49
作者零重力瓦力
评论0
阅读0

国外 AI 技术达人 Mervin Praison 讲解 DeepSeek 最新开源多模态模型:Janus Pro 7B,拥有比 LLaVA 等其他开源多模态模型更加卓越的性能。

功能亮点

  1. 基于 Deep Seek V2 构建,使用超过 9000 万训练样本,以及先进的合成美学数据训练(7200 万样本),不仅能够理解图像,还能生成图像。
  2. 支持 FAST API 和 Gradio
  3. 向公众免费开放,可通过 Hugging Face 获取,附完整文档!

技术规格

  1. 自回归 Transformer 架构
  2. 拥有文本编码器、标记器、图像解码器等组件
  3. 训练数据包含:图像、字幕、表格、图表、文档分析

应用场景

  1. 详细场景描述
  2. 地标识别
  3. 文本识别
  4. 图像生成
  5. 常识问答
  6. 视觉小说创作

下载地址:https://github.com/deepseek-ai/Janus

总之,DeepSeek Janis Pro 7B 不仅提供了国外顶尖闭源多模态模型的功能,而且免费开源,相当良心!

相关文章

互动讨论

评论区

围绕《DeepSeek 发布开源多模态模型 Janus Pro 7b,可本地部署》展开交流,未登录用户可浏览评论,登录后可参与讨论。

评论数
0
登录后参与评论
支持发表观点与回复一级评论,互动后将同步到消息中心。
登录后评论
暂无评论,欢迎成为第一个参与讨论的人。