
Google 测试 Gemini 桌面版屏幕共享 Live Mode
Google 发布 macOS 版原生 Gemini 桌面应用,采用 Swift 语言独立构建,短时间内完成超百项功能特性。开发者发现应用内置尚未激活的 Gemini Live 语音模式和屏幕共享功能,相关设置已就绪,球形悬浮界面清晰可见。 Google 将桌面端定位为“真正具备个性化、主动性的强大助手”,暗示未来数月内将有更多功能发布。随着 Google I/O 2026 大会临近,具备实时语音交互和屏幕共享能力的桌面 Live Mode 将成为其跨平台 AI 战略的重要落子。

Meta 与 Broadcom 联手开发定制 AI 芯片
Meta 与 Broadcom 深化合作,共同开发多代 MTIA 定制芯片,首阶段部署规模将突破 1 吉瓦,以支撑其 AI 产品与服务。 MTIA 定位内部推理与推荐任务加速, Meta 已在数据中心部署数十万颗该芯片。此番合作意味着 Meta 试图掌控从加速器到网络互联的完整底层栈,其“外部采购+内部定制”的双轨模式正在成为大型科技公司标配。

OpenAI 扩大 GPT-5.4-Cyber 可信访问权限
OpenAI 将可信访问网络安全计划大规模扩展,向数千名防御者开放专用模型 GPT-5.4-Cyber 。该模型专为防御性网络安全任务设计,可在缺少源代码的情况下进行二进制逆向工程,检测恶意代码和漏洞。同期推出的 Codex Security 安全智能体已在测试中扫描超过 120 万次代码提交,识别大量安全问题。 OpenAI 强调分级访问机制,目标是安全研究人员、防御工程团队等专业人士,并将安全能力与责任机制同步扩展作为核心理念。

Humwork A2P 市场连接 AI 智能体与专家
Humwork 推出首个 A2P (智能体对人)交易市场,解决 AI 能力边界问题。当智能体遇到无法处理的场景时,系统在 30 秒内匹配真人专家,通过 MCP 协议实现无缝协作,解决方案实时回传。平台已汇聚 1000+ 验证专家,覆盖工程、设计、法律等领域,达 87% 问题解决率。 Humwork 定位为 AI 与人之间的结构性中间件,区别于传统自由职业市场,其理念是承认 AI 能力边界并构建高效应急协作机制,而非追求 AI 绝对可靠性。

Google 在 Gemini 中测试智能体购物原生结账
Google 正为 Gemini 测试内置购物车功能,计划打造集商品浏览、购买、自动化任务于一体的 AI 商业入口。该功能基于年初发布的“通用商务协议”,可支持用户在 Target 、 Gap 等平台直接结账。结合 Chrome 端 Gemini Skills 和智能体浏览功能, Gemini 有望成为一站式 AI 应用,与 ChatGPT 、 Copilot 等展开正面竞争。预计将在 5 月 Google I/O 大会上正式亮相。

AI 如何让科技最具价值的资源走向大众
AI 正撬动芯片行业格局。 Nvidia 凭借 CUDA 软件生态建立的优势正面临挑战:初创公司 Wafer 用 AI 优化代码适配不同芯片, Ricursive 用 AI 设计芯片。科技巨头纷纷自研芯片,而 AI 编程能力的提升使 Nvidia 的软件壁垒不再不可逾越。未来芯片竞争将从硬件性能转向 AI 优化能力,谁的 AI 更懂硅,谁就能抢占先机。

Reid Hoffman 点评“tokenmaxxing”争议
LinkedIn 联合创始人 Reid Hoffman 公开为“tokenmaxxing”概念背书,认为追踪员工 AI Token 消耗量是观察组织 AI 采纳程度的有效指标。他指出用量高不等于效率高,探索性消耗是学习闭环的一部分,主张 AI 应嵌入组织全链条并建立定期分享机制。 Meta 此前因内部 AI 使用量排行榜争议引发关注,此类做法在行业内仍存争议。

Google 为 Mac 推出原生 Gemini 应用
Google 本周发布 macOS 原生 Gemini 应用,通过快捷键唤起、屏幕共享分析及多模态生成等功能,追赶 OpenAI 与 Anthropic 的桌面端布局。该应用将 AI 从“需要主动打开的工具”转变为“随时待命的协作者”,有望成为桌面端 AI 应用的新标准形态,现已向全球用户开放下载。

Gemini 3.1 Flash TTS :下一代富有表现力的 AI 语音技术
Google 发布 Gemini 3.1 Flash TTS 语音合成技术,实现可控制性、表现力和音质三维升级。该模型在 Artificial Analysis 评测中位列“最具吸引力象限”,支持 70 多种语言和多说话人对话。其核心创新的音频标签( Audio Tags )功能可将自然语言指令嵌入文本,实现精细化语音风格控制,降低了专业音频制作门槛,标志着语音合成从“能说”向“会说”的关键跃迁。所有生成音频均嵌入 SynthID 水印,可靠识别 AI 生成内容,对有声内容创作、虚拟助手、游戏配音等场景具有实用价值。