#OpenAI
DeepSeek 发布 DeepSeek-R1-Lite-Preview 推理能力直逼 o1-preview
DeepSeek发布轻量推理模型R1-Lite-Preview,在AIME和MATH基准上性能接近o1-preview,支持全程可追溯的透明推理。虽解“蜗牛爬井”题耗时24秒(o1-preview约5秒),但通过自我反思修正逻辑错误,最终得出正确答案。模型将开源并开放API。
奥特曼与哈佛商学院副院长德博拉·斯帕 AI 深度对话
奥特曼在与哈佛商学院副院长斯帕的对话中,首度详解OpenAI转向营利模式系因AI研发资金远超非营利架构承载能力;主张企业主导发展、政府聚焦安全监管,类比航空业多方协同机制;看好AI加速物理学突破,并提出通过全球用户对话萃取价值观,推动民主化AI治理。
OpenAI 上架 Windows 版 ChatGPT 桌面应用
OpenAI正式发布Windows版ChatGPT桌面应用,支持o1-preview等最新模型,集成Alt+Space快捷唤起、语音对话、网页搜索、Canvas协作画布、截图提问、多文件分析、DALL·E绘图及专业文案生成等功能,办公与创作更高效。
开源 AI OCR 工具 Zerox OCR
Zerox OCR 是一款开源、可本地部署的 AI OCR 工具,支持 PDF、DOCX 和图片等格式。它将文件转为图像序列后,调用 GPT 逐页识别并输出结构化 Markdown,最终合并为高保真文档,适合需隐私保护或批量处理非扫描类文档的用户。
超级好用的免费音视频字幕生成工具:Whisper Web
Whisper Web 是一款免费、本地运行的音视频字幕工具,基于 OpenAI Whisper Large v3 Turbo 模型,20秒即可为25分钟音频生成高精度字幕,全程离线、无需联网。支持 npm 快速启动,Firefox 用户需手动启用 Web Workers。
诺奖得主杰弗里·辛顿:萨姆·奥特曼对安全的关注远不如对利润的关注
诺奖得主辛顿透露,其得意门生曾开除奥特曼——因OpenAI初创时以安全为先,而奥特曼后期明显更重利润;这一转向或正是米拉·穆拉蒂等创始成员陆续离职的主因。
如何发挥 OpenAI o1-preview 的最大潜力
o1-preview 擅长深度推理,而非文案生成。要释放其博士级分析能力,需采用“人搜集+模型推理”协作流:先由其他工具收集并精炼信息,再将结构化文档与明确目标输入 o1,使其在战略规划、产品研发等复杂任务中提供高价值洞见。
奥特曼访谈:AI 如何重塑我们的工作方式和创造过程
奥特曼在Indeed访谈中强调,AI是增强人类表达与创造力的工具,将催生新型工作而非取代人类;ChatGPT成功源于技术进步与体验优化;Indeed已用OpenAI模型提升人岗匹配效率;他建议年轻人善用AI工具,并深耕对人性的理解。
OpenAI 推出实时语音 API 公测版
OpenAI 推出实时语音 API 公测版,支持低延迟流式语音对话、中断响应与函数调用,集成六种自然声音;同步在 Chat Completions API 中新增音频输入输出能力。开发者可用单一接口构建多模态对话体验,适用于教育、客服、辅助功能等场景。