Google 发布轻量级开源大模型:Gemma 3,让手机也能跑动大模型

Google发布开源大模型Gemma 3,含1B至27B多版本,其中1B版可在手机端流畅运行;原生支持140+语言及文本、图像、视频多模态输入,上下文窗口达12.8万Token;兼容Transformers、JAX等主流框架,继承Gemini 2.0核心技术,兼顾性能与终端部署效率。

发布于2025年3月12日 14:24
编辑零重力瓦力
评论0
阅读28

Google 推出新一代开源大模型 Gemma 3,其产品系列包含从 1B 到 27B 不等的多个版本。值得关注的是,全新推出的 1B 轻量级版本实现了在手机端的流畅运行,让 AI 应用场景得以进一步扩展。

在技术创新方面,Gemma 3 展现出多项突破性进展。模型原生支持 140 多种语言,能够同时处理文本、图像和视频等多种形式的输入。尤其令人瞩目的是,其上下文窗口已扩展至 12.8 万个 Token,相当于一次性可以处理一部完整小说的内容,大幅提升了对长篇文本的理解和处理能力。此外,优化后的函数调用机制和结构化输出功能,让 Gemma 3 能够更好地与各类工具和服务无缝对接。

开发者可以在 Google Colab、Vertex AI 或本地 GPU 环境中灵活使用 Gemma 3 进行模型微调。该模型完全兼容 Transformers、JAX、Keras、Ollama 等主流开发框架。通过与 NVIDIA、Hugging Face、AMD 等科技巨头的深度合作,Gemma 3 在各类硬件平台上都能发挥出卓越的性能。

Gemma 系列自发布以来下载量已突破一亿次,开发者社区基于此创建了超过 6 万个特色应用,充分体现了开源 AI 生态的蓬勃活力。尽管采用轻量级设计,Gemma 3 依然保持着强大的性能。这得益于它继承了 Gemini 2.0 的核心技术,并在多模态理解、长文本处理等关键领域实现了突破。Gemma 3 的成功或许预示着 AI 技术正在向一个新的发展阶段迈进:不再一味追求更大的模型规模,而是在确保性能的前提下,更加注重效率和实用性。

相关文章

三种记忆模式解决 AI 智能体的金鱼记忆
AI 新闻资讯
2026年5月12日
0 条评论
小创

三种记忆模式解决 AI 智能体的金鱼记忆

很多 AI 智能体表现“迟钝”,往往并非模型能力不足,而是缺乏记忆机制。Google 技术专家基于 ADK 提出三种解决方案:会话记忆让助手在单次对话中记住上下文;多智能体状态共享支持多个智能体通过键值对协作传递信息;持久化存储则利用数据库替代内存,使智能体能跨越重启记录用户偏好。这些方法能有效解决“金鱼记忆”问题,帮助开发者构建更连贯、具备长期服务能力的个人助理应用。

#智能体工程
阅读全文
ChatGPT 开始卖广告了,但 OpenAI 真正的野心在语音
AI 新闻资讯
2026年5月8日
0 条评论
小创

ChatGPT 开始卖广告了,但 OpenAI 真正的野心在语音

5 月 7 日,OpenAI 在英、巴等五国启动 ChatGPT 广告内测,并推出三款具备 GPT-5 级推理能力的实时语音模型。广告业务强调隐私与回答独立性,旨在探索免费用户变现路径。新语音模型则支持复杂任务操作,加速企业付费场景落地。此举标志 OpenAI 从技术验证转向商业模式规模化,证明 AI 产品可兼顾用户体验与多元盈利,为行业商业化提供了关键风向标。

#OpenAI
阅读全文
让 AI 视频拥有电影质感的九层结构提示词
AI 新闻资讯
2026年5月8日
0 条评论
小创

让 AI 视频拥有电影质感的九层结构提示词

如何让 AI 视频拥有电影质感?提示词应采用导演语言而非被动描述,需包含主体、微动作、环境、摄像机、灯光、风格、情绪、物理细节、渲染质量九层结构。文章还总结了微动作工程、摄像机定义、布光逻辑、情绪编码及可控混乱等策略,并提供了多条完整示例。创作者需注意框架易致同质化,真正的竞争壁垒在于对细节分寸和不可模板化判断的把握。

#Runway#视频生成
阅读全文
互动讨论

评论区

围绕《Google 发布轻量级开源大模型:Gemma 3,让手机也能跑动大模型》展开交流,未登录用户可浏览评论,登录后可参与讨论。

评论数
0
登录后参与评论
支持发表观点与回复一级评论,互动后将同步到消息中心。
登录后评论
暂无评论,欢迎成为第一个参与讨论的人。