
ChatGPT 图像 2.0 全新发布
ChatGPT Images 2.0 发布,重点不再局限于画质提升,而是将图像生成推向更精确、可控的生产工具层面。核心改进包括:文字渲染更稳定、多语言支持更强、风格跨度更大、版式比例更灵活。模型不再满足于生成“看起来像那么回事”的图片,而是覆盖设计、广告、教育、出版等实际工作流场景,目标是从灵感工具升级为半成品生产工具。真正难的从来不是生成一张惊艳样片,而是稳定地产出一批能用的东西。

工作中 Codex 的 10 大用途
OpenAI 发布 Codex 职场使用指南,列出 10 个典型场景,包括每日简报、周报、 PPT 、决策备忘录、文件清洗、表格合并、客户优先级排序、月末财务复盘、发布物料包和流程审计。指南强调 Codex 的核心价值不是生成内容,而是跨工具收集上下文,整理成可直接推进工作的交付物。它需标注来源、标清假设、标明缺失信息,确保可追溯性和复核要求,体现了从“任务-结果”模式向“持续在多工具间工作”的转变。真正的效率提升,来自智能体愿意替人处理那些每天拖慢组织运转的材料整理工作。
Pika 推出创作智能体,将聊天窗口变成一个“人”
Pika 推出创作智能体,将传统的图片视频生成提示词窗口升级为拥有形象、声音与个性的虚拟“人”。这一变化虽未改变底层技术逻辑,却把工具操作转化为拟人化交流体验。用户不再面对枯燥的输入框,而是能与有性格的智能体互动,为内容创作过程增添更多趣味与便捷。
2026 国内 Coding Plan
本文交叉验证并更新了国内主流大模型 Coding Plan 的最新价格与额度。核心发现包括:阿里云百炼 Lite 套餐已停售,智谱 GLM-5.1 再度提价且高峰期消耗加倍,火山方舟首月价微调。文章补充了联通云限时免费及优刻得支持 API 调用的新平台信息,并指出当前市场正从低价拉新转向停售低端套餐。针对不同使用场景,文中给出了从尝鲜到重度开发的具体选购建议。

插件与技能完全指南
OpenAI Academy 发布 Codex 指南,详解插件与技能的区别:插件用于连接外部工具获取信息,技能用于固化团队流程规范操作。两者结合使 Codex 从问答工具升级为可接入业务系统、理解团队习惯并按流程交付结果的工作智能体。核心价值在于帮助企业将分散的工作规则整理为可稳定执行的标准化流程。

Gemini Drops : 2026 年 4 月 Gemini 应用新更新
Google 在 Gemini Drops 第 10 期中推出多项更新,将 Gemini 从问答工具升级为深度嵌入工作流的 AI 入口。新增功能包括图像个性化、 Google 应用连接、项目管理工具 Notebooks 、 Mac 原生客户端、音乐创作 Lyria 3 Pro 及交互式可视化。核心方向是让 Gemini 更贴近用户的内容与任务处理场所,但个性化越深,数据边界与用户信任的挑战也越大。

Gemini Embedding 2 正式发布
Google 正式推出 Gemini Embedding 2 正式版,这是一款原生多模态嵌入模型,可统一处理文本、图像、视频和音频。该版本从预览进入生产可用阶段,标志着多模态检索技术从实验研究转向标准化基础设施,为企业提供稳定的多模态搜索与推理能力。

Gemini for Home 引入 Continued Conversation ,让聊天更自然高效
Google 为 Gemini for Home 推出“持续对话”功能,旨在解决智能家居语音交互中频繁唤醒、上下文丢失、误响应等体验短板。核心升级包括:支持对话上下文记忆、多语言覆盖、智能区分闲聊与指令,以及全屋用户共享使用。该功能让语音助手从一问一答模式向自然连续交流演进。分析认为, AI 进家门后竞争焦点已转向“打断更少、理解更准、接话更自然”的交互体验,家庭场景对 AI 的要求苛刻,真正做好连续对话和“少打扰”才能确立智能家居入口的主动权。

Deep Research Max :自主研究智能体的重大飞跃
Google 发布 Deep Research Max 研究智能体,基于 Gemini 3.1 Pro 构建,核心突破在于从“搜索总结工具”升级为可控、可编排的企业级研究流程。支持 MCP 接入私有数据源、多模态输入与原生图表生成,可同时调用搜索、 MCP 服务器、代码执行等完整工具链。系统还能在执行前预览修改研究计划,灵活调整调查范围。与 FactSet 、 S&P Global 等金融数据服务商合作,将专业研究做成稳定的后台基础设施,实现从“聊天机器人加搜索框”到企业级生产系统的转变。