资讯标签

#OpenAI

2024年11月15日

OpenAI 上架 Windows 版 ChatGPT 桌面应用

OpenAI正式发布Windows版ChatGPT桌面应用，支持o1-preview等最新模型，集成Alt+Space快捷唤起、语音对话、网页搜索、Canvas协作画布、截图提问、多文件分析、DALL·E绘图及专业文案生成等功能，办公与创作更高效。

开源 AI OCR 工具 Zerox OCR

Zerox OCR 是一款开源、可本地部署的 AI OCR 工具，支持 PDF、DOCX 和图片等格式。它将文件转为图像序列后，调用 GPT 逐页识别并输出结构化 Markdown，最终合并为高保真文档，适合需隐私保护或批量处理非扫描类文档的用户。

超级好用的免费音视频字幕生成工具：Whisper Web

Whisper Web 是一款免费、本地运行的音视频字幕工具，基于 OpenAI Whisper Large v3 Turbo 模型，20秒即可为25分钟音频生成高精度字幕，全程离线、无需联网。支持 npm 快速启动，Firefox 用户需手动启用 Web Workers。

诺奖得主杰弗里·辛顿：萨姆·奥特曼对安全的关注远不如对利润的关注

诺奖得主辛顿透露，其得意门生曾开除奥特曼——因OpenAI初创时以安全为先，而奥特曼后期明显更重利润；这一转向或正是米拉·穆拉蒂等创始成员陆续离职的主因。

如何发挥 OpenAI o1-preview 的最大潜力

o1-preview 擅长深度推理，而非文案生成。要释放其博士级分析能力，需采用“人搜集+模型推理”协作流：先由其他工具收集并精炼信息，再将结构化文档与明确目标输入 o1，使其在战略规划、产品研发等复杂任务中提供高价值洞见。

奥特曼访谈：AI 如何重塑我们的工作方式和创造过程

奥特曼在Indeed访谈中强调，AI是增强人类表达与创造力的工具，将催生新型工作而非取代人类；ChatGPT成功源于技术进步与体验优化；Indeed已用OpenAI模型提升人岗匹配效率；他建议年轻人善用AI工具，并深耕对人性的理解。

OpenAI 推出实时语音 API 公测版

OpenAI 推出实时语音 API 公测版，支持低延迟流式语音对话、中断响应与函数调用，集成六种自然声音；同步在 Chat Completions API 中新增音频输入输出能力。开发者可用单一接口构建多模态对话体验，适用于教育、客服、辅助功能等场景。

萨姆·奥特曼笔记本使用经验分享

萨姆·奥特曼偏爱螺旋装订笔记本，可平摊书写、轻松撕页，便于大量记录后筛选关键内容并多页并置比对；用毕纸张直接揉团丢弃。他要求纸张顺滑、封面硬挺、尺寸便携入袋，书写工具推荐三菱Uniball Micro 0.5mm与Muji深蓝墨水笔。

OpenAI o1 是如何诞生的

OpenAI推出o1-preview与o1-mini，首创“思考链”推理范式：模型在回答前自主进行多步推理，受AlphaGo启发，融合监督学习与强化学习。数学推演、代码自省及抽象概念理解能力显著提升；o1-mini以轻量架构实现近似推理性能，推动深度推理能力普惠化。

#OpenAI#强化学习#思维链

阅读全文

共 141 篇文章，第 14 / 16 页