OpenAI 推出 ChatGPT 协作界面:画布
OpenAI 推出 ChatGPT 协作新界面“画布”,由 GPT-4 驱动,支持在独立窗口中协同编辑文档与代码。现面向 Plus/Team 用户测试,企业与教育用户即将开放,后续将覆盖免费用户。具备精准选区反馈、快捷指令操作、版本回溯等功能,大幅提升写作与编码协作效率。
超好用的 AI 模型路由器:Not Diamond
Not Diamond 是一款智能 AI 模型路由器,自动匹配 GPT-4o、Claude 3.5、Llama 3.1 等 10 款语言模型及 DALL-E3、FLUX Dev 等绘画模型作答;支持 Arena 对比、手动指定与 API 调用(新用户享 10 万次免费额度),开源模型无限免费使用。
OpenAI 推出实时语音 API 公测版
OpenAI 推出实时语音 API 公测版,支持低延迟流式语音对话、中断响应与函数调用,集成六种自然声音;同步在 Chat Completions API 中新增音频输入输出能力。开发者可用单一接口构建多模态对话体验,适用于教育、客服、辅助功能等场景。
解锁 Runway Gen-3 视频风格迁移新玩法
Runway Gen-3 新增视频风格迁移功能,实拍手影戏等素材可一键转为动画风格,操作简单、无需专业技能,显著降低AI动画创作门槛。
AI 眼镜 I-XRAY 引发隐私担忧
AI眼镜I-XRAY可实时识别人脸并从公开网络抓取住址、电话等隐私信息,技术本身并不复杂,却暴露了当前人脸识别、LLM与公共数据库结合带来的现实风险。开发者强调其初衷是警示而非滥用,并提供PimEyes等平台的信息删除指南。
两分钟讲述人类利用技术讲故事的历史
Runway发布2分钟短片,梳理从洞穴壁画、手抄本、印刷术到电影、电视、互联网及AI生成内容的叙事技术演进。视频指出,技术形态持续更迭,但人类对故事的本质渴求始终如一,也由此引出对下一代叙事方式的思考。
最新 AI 视频制作工作流
新AI视频工作流整合Magnific Mystic v2(图像更逼真高清)、ChatGPT-4o Advanced Voice(情感化语音合成)与可灵1.5(单次生成60秒口型同步视频),实现高拟真、强情感的端到端视频创作,适合需快速产出高质量对话类视频的创作者。
Pika 1.5 视频特效演示
Pika 1.5上线六种趣味物理特效:充气、融化、爆炸、压扁、压碎和蛋糕化,可对生成视频进行直观可控的风格化变形,让AI视频编辑更富表现力与创意空间。
Pika 1.5 发布,一键生成 6 种特效
Pika 1.5 正式发布,新增充气、融化、爆炸、压扁、压碎、蛋糕化六种一键视频特效,大幅降低创意视频制作门槛,让普通用户也能轻松实现趣味动态效果。