Google Veo 3.1 新功能及亮点介绍
Google Veo 3.1 新增视频编辑能力,支持在原视频中增删物体;推出“配料表”功能,可融合最多3张图片生成连贯视频;延长视频时能一致保持人物、画面、音效、背景音乐及人声对白;还支持首尾帧控制。目前仅限Google Flow平台使用,Gemini暂未开放。
Freepik 支持 Veo 3.1
Freepik 已接入 Google 最新视频生成模型 Veo 3.1,人物一致性显著提升,更适合生成叙事性强、时长较长的视频内容,为创作者提供更稳定可靠的 AI 视频生成体验。
Higgsfield 推出基于 Sora2 的草图转视频功能
Higgsfield 基于 Sora 2 推出草图转视频功能,用户上传手绘草图并添加文字描述,即可一键生成动态视频,大幅提升故事板制作效率与视觉表现力。目前开放体验:higgsfield.ai/sketch-to-video
火爆网络的 Sora 2 到底好不好用
Sora 2 凭借逼真物理模拟、12秒1080p视频生成与“Cameo”数字分身功能走红,操作简单、成片接近电影预告水准;但镜头/光线控制弱、人物场景一致性不足,暂不支持长视频与精细调优,更适合创意短片与社交玩梗,专业制作仍需配合传统工具。
AI 定格动画:走出花园的篱笆
Freepik发布全AI生成定格动画《走出花园的篱笆》,角色、场景、动作与合成均未依赖实拍或手工逐帧,全程由AI工具完成。官方同步公开完整制作流程,为传统动画创作提供可复用的技术路径。
Luma Ray 3 图片注解(Annotation)功能
Luma Ray 3 新增图片注解功能,支持在图像上直接绘制标记并添加文字说明,便于精准定义关键帧与运动轨迹,提升视频生成过程中对细节动作的控制力。
ChatGPT 背后最关键的数学工具
ChatGPT背后最核心的数学工具是线性代数:词被转为向量,向量构成矩阵,神经网络靠矩阵与向量运算理解语言、捕捉语义;Transformer的注意力机制也依赖点积和矩阵乘法,GPU则专为这类运算优化。想入行大模型研发,线性代数是绕不开的基础。
什么是 MCP 它和传统 API 有什么不同
MCP(模型上下文协议)是Anthropic推出的开源标准,让大模型能通过自然语言描述自主调用外部工具与数据,无需手动编码;相比传统API的强耦合、高门槛,MCP更灵活易扩展,已接入GitHub、家居自动化、网页浏览等丰富服务,正加速构建智能体开发生态。
对工作的倦怠来自缺乏进展
萨姆·奥特曼指出,工作倦怠的根源常非劳累过度,而是长期缺乏进展或反复失败;创业者与职场人都易陷入“努力却无果”的误区。真正可持续的动力,来自热爱之事中可感知的进步——及时止损、调整方向,比硬扛更关键。