DeepSeek 发布开源多模态模型 Janus Pro 7b，可本地部署

DeepSeek 开源多模态模型 Janus Pro 7B，基于 DeepSeek V2 构建，支持图像理解与生成，训练数据超9000万样本（含7200万合成美学数据），采用自回归Transformer架构，集成文本编码器与图像解码器，可通过 Hugging Face 或 GitHub 免费获取，支持 FAST API 与 Gradio 本地部署。

发布于2025年1月29日 07:49

编辑零重力瓦力

评论0 条

阅读51

#DeepSeek #多模态 #图像生成

国外 AI 技术达人 Mervin Praison 讲解 DeepSeek 最新开源多模态模型：Janus Pro 7B，拥有比 LLaVA 等其他开源多模态模型更加卓越的性能。

功能亮点

基于 Deep Seek V2 构建，使用超过 9000 万训练样本，以及先进的合成美学数据训练（7200 万样本），不仅能够理解图像，还能生成图像。
支持 FAST API 和 Gradio
向公众免费开放，可通过 Hugging Face 获取，附完整文档！

技术规格

自回归 Transformer 架构
拥有文本编码器、标记器、图像解码器等组件
训练数据包含：图像、字幕、表格、图表、文档分析

应用场景

详细场景描述
地标识别
文本识别
图像生成
常识问答
视觉小说创作

下载地址：https://github.com/deepseek-ai/Janus

总之，DeepSeek Janis Pro 7B 不仅提供了国外顶尖闭源多模态模型的功能，而且免费开源，相当良心！

一个人用 Claude 把 53 万行 Zig 重写成 Rust

Bun 开发者利用 Claude Fable 5 在 11 天内将 53.5 万行 Zig 代码重写为 Rust，以解决内存安全问题。项目采用 64 个 AI 实例并行及对抗性审查机制，耗资约 16.5 万美元。重写后二进制体积缩减 20%，性能提升 2% 至 5%。尽管存在 1.3 万个 unsafe 块和 19 个回归问题引发争议，但该项目验证了 AI 辅助大规模重构的可行性，其分离上下文与对抗审查等方法论具有重要参考价值。

JetBrains Junie 正式版：AI 编程 Agent 学会了用调试器断点

JetBrains AI 编程 Agent Junie 正式 GA，在 SWE-Rebench 基准测试中排名第一。其核心优势在于深度集成 IDE 原生工具链，而非模拟替代。主要特性包括：Plan 模式生成结构化计划文档以防跑偏；原生调试器集成支持断点与运行时状态检查；支持异步远程控制长任务；基于项目上下文的交互式代码审查；以及模型自由切换以优化成本。Junie 标志着 AI 编程竞争正从模型能力转向工具集成深度。

别再纠结 Claude Code 还是 Cursor，高效开发者在同时用两个

高效开发者倾向于组合使用 AI 编程工具而非二选一。实战表明，Cursor 适合单文件精细调整，Claude Code 擅长跨文件重构与后台任务，两者互补可显著提升效率。多智能体并行及“先规划后编码”策略能加速 SaaS 开发，但需警惕 AI 生成质量下滑等问题。此外，Hermes Agent 等自动化工具可替代人工定时任务。建议以 Cursor 为主、Claude Code 处理复杂任务，初学者应循序渐进掌握工具组合拳。

#Claude Code#AI 编程

阅读全文

互动讨论

评论区

围绕《DeepSeek 发布开源多模态模型 Janus Pro 7b，可本地部署》展开交流，未登录用户可浏览评论，登录后可参与讨论。

评论数

登录后参与评论

支持发表观点与回复一级评论，互动后将同步到消息中心。

登录后评论

暂无评论，欢迎成为第一个参与讨论的人。

DeepSeek 发布开源多模态模型 Janus Pro 7b，可本地部署

功能亮点

技术规格

应用场景

相关文章

一个人用 Claude 把 53 万行 Zig 重写成 Rust

JetBrains Junie 正式版：AI 编程 Agent 学会了用调试器断点

别再纠结 Claude Code 还是 Cursor，高效开发者在同时用两个

评论区