第十一天:ChatGPT 桌面应用重磅升级,让智能助手无处不在!
ChatGPT 桌面应用迎来重磅升级:支持快捷唤起(Option+Space)、屏幕上下文理解、终端命令生成、代码实时模拟、联网搜索与引用标注,以及趣味语音交互。深度融入 macOS 工作流,程序员可联动终端与 IDE,写作者获风格化文案与可信信源支持,Windows 版本即将上线。
可灵 v1.6 & v1.5 深入对比
可灵v1.6在图生视频任务中显著优化:人物与背景变形大幅减少,原始图像风格保留更完整;动作更自然、镜头切换更合理;对提示词遵循度更高,幻觉与冗余细节(如无指令的飘动、走动)明显降低;复杂场景如汽车运动的环境适配与结尾处理也更精准。
第十天:OpenAI 带来 ChatGPT 的两种复古新玩法
OpenAI 推出 ChatGPT 全新交互方式:美国用户可拨打 1-800-CHAT-GPT(每月15分钟免费),支持翻盖手机、转盘电话语音互动;全球用户还能通过 WhatsApp 文字聊天,实现多语言学习、实时问答、个性化食谱生成等,进一步降低 AI 使用门槛。
Google Veo 2 vs OpenAI Sora
Google Veo 2 与 OpenAI Sora 在视频生成风格上走向两极:Sora 偏爱高饱和、超现实的动态表现,擅长奇幻构想;Veo 2 则专注自然色调与符合物理规律的写实运动,更贴近真实世界交互。两者均能精准响应复杂提示词,覆盖日常、科学乃至幻想场景。
十大 AI 视频生成模型对比
用同一段“东京霓虹街头女性行走”提示词,实测Pika、Sora、Runway等十大AI视频模型生成效果,在画质清晰度、运镜自然度、服饰/光影细节和风格还原力四方面横向对比,帮你快速判断哪些模型更适合创意落地或专业生产。
第九天:OpenAI API 重磅升级:开发者的狂欢日,功能更新引爆创意
OpenAI“开发者日”重磅升级API:o1模型正式上线,支持视觉输入、函数调用、结构化输出及可调节的“推理努力度”;实时API集成WebRTC,实现低延迟音视频交互;新增偏好微调功能,提升定制准确率;Go/Java SDK发布,API成本最高降10倍。
第八天:ChatGPT 搜索功能全面升级
ChatGPT 搜索功能全面升级,支持实时网络检索、对话中自然触发、语音输入及地图可视化,覆盖活动、天气、美食等高频场景;搜索速度显著提升,且已向全球免费用户开放。这不仅是功能迭代,更标志着AI原生搜索正重塑信息获取范式。
Midjourney 发布个性化风格模型架构新方法:情绪板
Midjourney 推出“情绪板”个性化风格架构,支持上传任意图片构建多组可命名风格配置;收敛速度提升至最高5倍,仅需40次评价即可起步,200次趋于稳定,大幅降低定制门槛。
谷歌发布全新视频与图像生成技术更新:Veo 2、Imagen 3 和 Whisk
谷歌推出Veo 2、Imagen 3与Whisk:Veo 2支持4K电影级视频生成,可精准控制镜头参数与胶片质感;Imagen 3显著提升图像细节与真实感;Whisk则为创意工作者提供新工具。三者协同强化AI在专业视觉创作中的可控性与表现力。