#Gemini
Google AI Studio 上线了屏幕实时分享功能
Google AI Studio 新增屏幕实时分享功能,支持串流 Chrome 标签页,让 Gemini 实时“看见”页面内容并语音交互,适用于编程辅助等场景;英文语音识别流畅,中文识别偶有误判为日文的情况。
Google 推出 Gemini 2.0 Flash 原生图像生成功能
Google 正式向所有支持地区开发者开放 Gemini 2.0 Flash 原生图像生成功能,可在 Google AI Studio 和 Gemini API 中调用。它支持文本生成图像、对话式实时编辑、常识推理保障内容合理性,并显著提升图像中文字渲染的准确性,适用于故事配图、广告设计等场景。
Gemini 2.0 Flash (Image Generation) 终极图像编辑工具
Gemini 2.0 Flash(图像生成)上线Google AI Studio,免费提供基于自然语言的智能图像编辑能力:支持精准元素替换、多图融合、人物一致性保持、视角与构图调整、物理场景理解重设计、水印去除及情节化插图生成,大幅降低专业级图像编辑门槛。
如何通过 Gemini 2.0 创作图像小说和电影分镜
Gemini 2.0 已深度集成 Imagen 图像生成能力,支持用自然语言(含中文)连续生成风格、人物、场景一致的分镜图像。Anu Aakash 仅凭情节描述、镜头要求与闪回指令,就高效产出多组电影级分镜,零绘画基础也能完成图像小说与影视前期创作,现通过 Google AI Studio 或 Gemini 免费使用。
Gemini Deep Research 实测
实测Gemini Deep Research生成《量子退火为何采用磁通量子比特》报告:自动规划8步研究方案,7分钟检索96个网站,产出含图表、逻辑清晰的完整分析,并支持导出多格式;目前每日限免5次。
Gemini Deep Research 圆桌访谈
Google推出免费Gemini Deep Research智能体,每日限5次;能自动拆解复杂问题、多源检索并生成深度报告,全程约5分钟,节省数小时人工研究。支持异步运行,用户可中途离开后返回查看结果,适用于学习、育儿、分析及生活决策等场景。
Google Gemini 2.0 与 GenAI SDK:简化 AI 应用开发
Google发布Gemini 2.0与GenAI SDK,支持文本、图像、音频、视频多模态理解;SDK提供简洁API、自动上下文管理及多模态任务封装,可从AI Studio原型开发无缝迁移至Vertex AI生产部署,无需重写代码,显著降低AI应用开发门槛。
Gemini Robotics:让 AI 走入现实世界
Google DeepMind推出基于Gemini 2.0的两款具身智能模型:Gemini Robotics具备视觉-语言-行动能力,可直接控制ALOHA 2、Franka及人形机器人“阿波罗”;Gemini Robotics-ER强化空间理解与具身推理,任务成功率提升2–3倍,并引入分层安全机制与ASIMOV安全评估数据集。
谷歌发布结合 Colab 和 Gemini 的 AI 数据科学助手
谷歌在Colab中推出集成Gemini 2.0的数据科学助手,支持用自然语言指令自动生成可运行、可协作的完整分析笔记本,自动处理代码编写、数据导入与环境配置,显著降低数据分析门槛,提升效率与协作体验。