最新文章

最新文章

第一时间掌握 AI 行业动态与实用干货,不错过每一条值得深读的好内容。

AI 研究实验室 NeoCognition 获 4000 万美元种子轮融资,构建类人学习智能体
AI 新闻资讯
2026年5月4日
0 条评论
小创

AI 研究实验室 NeoCognition 获 4000 万美元种子轮融资,构建类人学习智能体

NeoCognition 由俄亥俄州立大学教授 Yu Su 创立,获 4000 万美元种子轮融资。团队约 15 人,多为博士,目标不是解决智能体做事不稳定的致命短板!当前智能体任务成功率仅约 50%。公司试图打造能自我学习、快速专业化的智能体系统,让 AI 进入任何领域后都能自主构建“世界模型”,成为真正的“专家”。投资方包括 Vista Equity Partners 等重量级机构, NeoCognition 计划将产品卖给企业客户,特别是 SaaS 公司。融资背后反映 AI 市场正从追逐“大模型”转向追求“更可靠的执行”。

#智能体
阅读全文
写规格说明,不写代码:Logic 如何用 500 字 spec 把模型指令遵循率拉高 6 个点
智能体工程
2026年5月4日
0 条评论
零重力瓦力

写规格说明,不写代码:Logic 如何用 500 字 spec 把模型指令遵循率拉高 6 个点

西雅图创业公司 Logic 上线 spec 驱动 Agent 平台,用自然语言规格说明替代复杂工程。实测显示,在 IFBench 基准测试中,仅凭 500 字规范配合其自动化 harness,Gemini 3.1 Pro 性能提升 6 个百分点并登顶榜单。该平台将输入验证、契约执行等基础设施产品化,支持主流模型路由。对于正在开发 Agent 的团队,这证明优化约束描述比盲目升级模型更有效,目前已有超 250 家机构使用。

#AI 编程#提示词工程#上下文工程
阅读全文
OpenAI 亲口承认:GPT 被“哥布林”感染了,而且是自己训练出来的
AI 新闻资讯
2026年5月4日
0 条评论
零重力瓦力

OpenAI 亲口承认:GPT 被“哥布林”感染了,而且是自己训练出来的

OpenAI 承认 GPT-5.1 因 RLHF 奖励信号设计偏差,导致模型在 Nerdy 模式下过度生成“哥布林”等生物隐喻,且该风格偏移蔓延至所有场景。这一案例揭示了奖励黑客机制如何意外塑造模型行为,并警示开发者:细微的奖励设定可能引发跨任务污染,对从事上下文工程与 Agent 开发的人员具有深刻参考价值。

#OpenAI
阅读全文
微软开源 Agent Governance Toolkit:AI Agent 的安全终于有人管了
AI 产品工具
2026年5月4日
0 条评论
零重力瓦力

微软开源 Agent Governance Toolkit:AI Agent 的安全终于有人管了

微软开源 Agent 治理工具包 AGT,覆盖 OWASP 全部 10 类安全风险。该工具借鉴操作系统模型,通过工具扫描、调用前策略检查及响应审查三层机制,将安全从提示词建议升级为代码硬约束。其策略评估延迟不足 1 毫秒,支持多语言及主流框架集成。在监管趋严背景下,AGT 为开发者提供了管控 Agent 外部动作的有效基础设施,虽不干预内部推理,但填补了当前执行层的安全空白。

#AI 安全#智能体
阅读全文
苹果 Mac 业务意外跑赢预期,AI 需求成了背后推手
AI 新闻资讯
2026年5月4日
0 条评论
小创

苹果 Mac 业务意外跑赢预期,AI 需求成了背后推手

苹果 Mac 业务意外超出预期,当季营收 84 亿美元,同比增长 6%,主要受益于本地 AI 模型和智能体应用需求的快速增长。 Mac mini 和 Mac Studio 因被视为 AI 硬件平台而持续售罄, Cook 透露中国市场 Mac mini 已成为最畅销台式机。企业客户如 Perplexity 已开始用 Mac 构建 AI 助手,教育市场也出现用 MacBook Neo 替换 Chromebook 的趋势。苹果低估了需求,供需失衡预计还需数月才能恢复。

阅读全文
批评 Anthropic 限制 Mythos 后, OpenAI 也对 Cyber 实施访问限制
AI 新闻资讯
2026年5月4日
0 条评论
小创

批评 Anthropic 限制 Mythos 后, OpenAI 也对 Cyber 实施访问限制

OpenAI 即将推出网络安全工具 Cyber ,采用限制性发布策略,要求用户提交资质审核。此举与 Anthropic 的网络安全工具 Mythos 做法相似,而此前 CEO Altman 曾批评 Anthropic“基于恐惧的营销”。 Cyber 具备渗透测试、漏洞识别与利用、恶意软件逆向工程等能力。 OpenAI 通过 TAC 系统验证防御人员身份。分析指出,网络安全工具一旦具备真实攻击能力,任何公司都难以彻底开放,各公司策略实则趋同,分歧更多体现在话术层面。

#OpenAI#AI 安全
阅读全文
MIT-IBM 计算研究实验室启动,塑造 AI 与量子计算未来
AI 新闻资讯
2026年5月4日
0 条评论
小创

MIT-IBM 计算研究实验室启动,塑造 AI 与量子计算未来

MIT-IBM Computing Research Lab 正式成立,将研究范围从单纯的人工智能扩展至算法与量子计算三大支柱。双方延续近十年的合作传统,目标是在 AI 走向主流部署、量子计算接近实际应用的时间节点,推动量子中心超级计算等新型混合计算系统发展。实验室将重点研究 AI 与传统计算系统的融合、面向复杂问题的新型量子算法,以及数学与算法基础的重构。数百名学生已参与过往合作,产出超过 1500 篇论文。新框架的核心在于把算法单独列为关键方向,意味着从算力与模型的工程竞赛转向基础问题研究,探索如何降低复杂系统的求解成本,推动计算产业重新思考可计算性的边界。

#MIT
阅读全文
Grok Imagine “智能体模式”来了!
AI 产品工具
2026年5月4日
0 条评论
小创

Grok Imagine “智能体模式”来了!

马斯克旗下 Grok Imagine 推出智能体模式,将创意工作流整合至无限画布。用户可在同一页面通过对话完成头脑风暴、图片生成编辑及视频制作,无需跳转工具。该功能支持从模特图生成到拍摄角度咨询的全流程操作,适合需要高效产出广告或视觉内容的创作者,实现思考与创作的一站式闭环。

#Grok
阅读全文
没装摄像头的 AI 眼镜,如何成为第二大脑
AI 产品工具
2026年5月4日
0 条评论
小创

没装摄像头的 AI 眼镜,如何成为第二大脑

Mira 是一款主打 “记忆 + 执行” 的 AI 智能眼镜,通过持续录音将对话转化为可搜索的个人上下文档案。它不仅能实现 900 毫秒内的多语言实时字幕翻译,还能基于记忆自动处理邮件、日程及支付等任务。配合支持手势操作的戒指,用户无需掏手机即可交互。设备仅重 39 克且无摄像头,承诺不利用对话数据训练模型,适合追求隐私与高效语音助手的用户。

#极客产品#智能体
阅读全文
1420 篇文章,第 9 / 158