三种记忆模式解决 AI 智能体的金鱼记忆
很多 AI 智能体表现“迟钝”,往往并非模型能力不足,而是缺乏记忆机制。Google 技术专家基于 ADK 提出三种解决方案:会话记忆让助手在单次对话中记住上下文;多智能体状态共享支持多个智能体通过键值对协作传递信息;持久化存储则利用数据库替代内存,使智能体能跨越重启记录用户偏好。这些方法能有效解决“金鱼记忆”问题,帮助开发者构建更连贯、具备长期服务能力的个人助理应用。
ChatGPT 开始卖广告了,但 OpenAI 真正的野心在语音
5 月 7 日,OpenAI 在英、巴等五国启动 ChatGPT 广告内测,并推出三款具备 GPT-5 级推理能力的实时语音模型。广告业务强调隐私与回答独立性,旨在探索免费用户变现路径。新语音模型则支持复杂任务操作,加速企业付费场景落地。此举标志 OpenAI 从技术验证转向商业模式规模化,证明 AI 产品可兼顾用户体验与多元盈利,为行业商业化提供了关键风向标。

让 AI 视频拥有电影质感的九层结构提示词
如何让 AI 视频拥有电影质感?提示词应采用导演语言而非被动描述,需包含主体、微动作、环境、摄像机、灯光、风格、情绪、物理细节、渲染质量九层结构。文章还总结了微动作工程、摄像机定义、布光逻辑、情绪编码及可控混乱等策略,并提供了多条完整示例。创作者需注意框架易致同质化,真正的竞争壁垒在于对细节分寸和不可模板化判断的把握。
LM Studio 和 Ollama 到底该选哪个
本地部署大模型时,LM Studio 与 Ollama 各有侧重。前者主打图形化界面,适合快速上手和模型对比。后者作为后台引擎,性能更优且支持自动硬件调用,在自动化工作流中表现更佳。随着版本迭代,两者功能边界虽逐渐模糊,但在 API 兼容性、并发处理及智能体集成方面,Ollama 仍具备明显优势。用户可根据是追求便捷体验还是深度集成需求来选择合适的工具。

哈佛研究: AI 急诊诊断准确度超越两位医生
哈佛团队研究显示, OpenAI 的 o1 模型在急诊分诊的文本诊断中准确率达 67%,略优于内科医生的 50-55%。但研究者强调,这仅测试了文本处理能力, AI 尚无法替代临床决策中的责任归属、患者沟通及复杂情境判断。

奥斯卡新规: AI 生成演员和剧本无参评资格
奥斯卡学院公布新版评奖规则,明确生成式 AI 使用边界。规则要求参评表演必须获得本人同意,剧本必须属于“人类创作”。此调整旨在回应 AI 技术快速进入影视生产引发的争议,守住创作主体地位。学院聚焦“谁在表演、谁在写作”这一核心问题,既不全面禁用 AI ,也不接受技术中立说,而是通过资格认定来保护署名、授权和创作者身份的传统秩序。

ChatGPT Images 2.0 在印度受热捧,但目前在其他地方尚未大获成功
虽然 OpenAI 声称印度成为 ChatGPT Images 2.0 最大用户市场,但第三方数据显示全球增长实则温和,下载量仅增 11%,日活和流量涨幅约 1%。巴基斯坦、越南、印尼等新兴市场反而出现高达 79%的下载增长。印度用户主要将该功能用于个人表达场景,如风格化肖像、社交头像等,反映出 AI 图像工具在不同市场的落地方式存在差异。

马斯克作证: xAI 用 OpenAI 模型训练 Grok
Musk 在法庭作证时承认 xAI 确实使用 OpenAI 模型进行蒸馏训练 Grok ,并坦言这在 AI 行业是普遍做法。这桩诉讼撕开了大模型竞争中被默认存在却少有人承认的另一面。头部公司间也在相互“借力”。蒸馏通过系统性查询现成模型,可低成本训练出性能接近的替代模型,直接削弱领先者的投入回报。前沿实验室正通过“前沿模型论坛”联合应对,但服务条款和访问权限正在成为新的竞争边界。

Google Cloud 推出两款 AI 芯片,剑指英伟达
Google Cloud 发布第八代 TPU 芯片,首次拆分为训练专用 TPU 8t 和推理专用 TPU 8i ,性能较上代提升 3 倍,成本效率提高 80%。此举旨在精细化分工以提升竞争力,但 Google 明确表示不会“去 Nvidia 化”,而是采取自研芯片与 Nvidia 并行的务实策略。 AI 云竞争已从单芯片比拼转向芯片、网络、软件栈和集群调度的整体系统能力。对客户而言,关键不在于芯片归属,而是什么组合能在具体任务中跑得更快、更省、更稳。