Opreator 个性定制功能,让 AI 成为真正的私人助理
OpenAI 推出智能助理 Operator,支持用户为特定网站(如 Priceline)定制提示词,明确偏好——例如“免费早餐+全额退款”。Operator 会据此自动筛选匹配选项,让 AI 助理真正理解并执行个人需求,成为可信赖的私人助手。
Perplexity 推出智能语音助手:Assistant
Perplexity 推出语音助手 Assistant,融合推理与实时搜索能力,可跨应用完成订餐、找歌、叫车、写邮件、设提醒等复杂任务,让日常事务处理更自然高效。
OpenAI Operator:能模拟人类操作浏览器来完成各种任务
OpenAI推出Operator智能体,基于GPT-4驱动的计算机操作智能体(CUA),能像人一样看屏幕、点鼠标、输文字,在各类网站自主完成订餐、购票、购物等任务;支持关键步骤确认与人工接管,不依赖API,兼顾效率与安全。
OpenAI 科学家 Noam Brown:AI 深度思考 20 秒,模型性能提升 10 万倍
OpenAI科学家Noam Brown在TED演讲中指出,AI在扑克任务中仅多花20秒深度思考,性能提升等效于模型规模与训练时间扩大10万倍。这一发现凸显“思考时长”的价值远超单纯堆叠算力,也为理解人类深度思考的本质提供了新视角。
Netflix 精准动作控制 AI 视频模型:Go-with-the-Flow AI
Netflix推出Go-with-the-Flow AI模型,仅通过替换高斯噪声为“变形噪声”微调基础视频模型,即实现动作迁移、镜头控制、“剪切拖拽”动画、转台运动引导及文本/图像驱动的3D一致视频生成,全程零计算增量,支持I2V与T2V双路径。
Deepseek + RAG:创建本地运行的强大智能体
基于DeepSeek R1大模型与RAG技术,结合Ollama本地部署、NOMIC嵌入模型和Streamlit界面,可快速构建防幻觉、支持PDF知识库接入的本地智能聊天机器人,全程代码简洁,适合开发者快速上手。
2025 年 1 月 AI 编码领域图谱
2025年1月AI编码工具图谱发布,按能力划分为L1–L5五级:从基础代码补全(L1)到AI驱动的开发团队协作(L5);标注颜色直观区分可用状态与模型类型,覆盖Web开发与通用场景,为开发者选型提供清晰参考。
Suno “垫声”,让AI成为我们的艺术创作伙伴
Suno 推出“垫声”技术,用户只需哼唱或录入任意声音,AI 即可生成完整歌曲。类比绘画中的“垫图”,它让音乐创作从专业门槛走向人人可为,AI 不再是被动工具,而是能响应直觉、激发灵感的创作伙伴。
Perplexity 推出 Sonar API,以实时 AI 搜索挑战 Google 和 OpenAI
Perplexity 推出企业级 Sonar API,含基础版与 Sonar Pro 两版本;后者在 SimpleQA 基准测试中 F 值达 85.8,超越 GPT-4 和 Claude,支持实时网络搜索与可溯源引用,基础版仅每千次 5 美元,已集成至 Zoom AI Companion 2.0。