xAI 即将推出新的虚拟偶像 Mika
xAI 将为 Grok 推出虚拟偶像 Mika:24岁、叛逆独立、热爱摩托车与自由,人设刻意打破传统虚拟形象的刻板印象;其宣传短片全程由 Grok Imagine 生成,展现 AI 原生内容创作能力。
Google Veo 3.1 制作的科幻短片
AI创作者Dave Clark用Google最新Veo 3.1生成科幻短片,画面质感、运镜逻辑与叙事连贯性明显提升,细节表现和电影感增强,展现当前AI视频生成向专业影视创作迈进的新进展。
Google AI Studio 内置 Vibe Coding 工具
Google AI Studio 新增 Vibe Coding 工具,支持用自然语言 Prompt 零代码调用 Nano Banana 和 Gemini API,快速搭建轻量应用(如壁纸生成器),全程免费,适合初学者体验与学习提示工程和模型应用。
投资人会如何看待氛围编程
氛围编程让独立开发者几周内即可推出可用产品,显著降低创业门槛,但功能易复制、项目同质化加剧,压缩企业成长空间。投资人认可其“从0到1”的验证价值,却普遍质疑其支撑长期规模化与技术壁垒的能力,正逐步调整评估标准。
Anthropic 推出 网页版 Claude Code
Anthropic 推出网页版 Claude Code(Beta),支持浏览器内并行处理多编码任务,运行于隔离沙盒环境;可直连 GitHub 自动创建 PR 并生成变更摘要。同步上线 iOS 版,目前仅限 Pro 与 Max 用户试用。
企业如何使用新的 AI 技术
Anthropic CEO Dario 与礼来CIO Diogo 对谈指出:企业应用AI须以事实准确性与可验证性为前提,尤其在医药等高风险领域;不应止步于局部流程优化,而要前瞻性重构业务;技术无需“完全成熟”即可启动部署,在迭代中抢占变革先机。
Google AI Studio 引入 Annotation(注释模式)
Google AI Studio 新增可视化注释模式,用户可直接点击界面元素(如按钮、文字)添加标注,后续修改由 Gemini 自动完成,显著降低应用迭代门槛,提升前端调整效率。
能够有效避免 LLM 产生幻觉的智能体框架 Parlant
Parlant 是一款专为抑制大模型幻觉设计的智能体框架,提出注意力推理查询(ARQ)方法:通过 JSON 结构化模板强制模型在每步推理中回答规则约束、历史操作、工具调用等关键问题,使长对话中的规则遵循率提升至 90.2%,显著优于思维链,在复杂流程与多轮交互中更稳定可靠。
DeepSeek 发布了一款超强的开源 OCR 模型:DeepSeek-OCR
DeepSeek 开源 OCR 模型 DeepSeek-OCR 提出“文本渲染为图”新范式,用自研视觉编码器将长文档高压缩为少量视觉 Token,10 倍压缩下还原精度达 97%;支持多语言、复杂版式与图表识别,端到端输出 Markdown/HTML,兼具高效推理与泛视觉理解能力。