Freepik 支持 Veo 3.1
Freepik 已接入 Google 最新视频生成模型 Veo 3.1,人物一致性显著提升,更适合生成叙事性强、时长较长的视频内容,为创作者提供更稳定可靠的 AI 视频生成体验。
Higgsfield 推出基于 Sora2 的草图转视频功能
Higgsfield 基于 Sora 2 推出草图转视频功能,用户上传手绘草图并添加文字描述,即可一键生成动态视频,大幅提升故事板制作效率与视觉表现力。目前开放体验:higgsfield.ai/sketch-to-video
Luma Ray 3 图片注解(Annotation)功能
Luma Ray 3 新增图片注解功能,支持在图像上直接绘制标记并添加文字说明,便于精准定义关键帧与运动轨迹,提升视频生成过程中对细节动作的控制力。
Nano Banana!Gemini 的图片编辑功能迎来重大升级
Gemini 推出全新图片编辑模型 Nano Banana,显著提升人物特征一致性,支持换装、换景、多图合成、多轮编辑与风格迁移。免费用户可用,所有生成图均带可见水印及 SynthID 隐形水印,兼顾创意自由与内容可追溯性。
Google 图像模型 Gemini 2.5 Flash Image 介绍
Google 推出 Gemini 2.5 Flash Image(nano-banana),支持多图融合、角色一致性保持、自然语言精准编辑及基于世界知识的语义理解,已在 Gemini API、AI Studio 和 Vertex AI 开放预览,定价约 0.039 美元/张,附带 SynthID 水印。
Elevenlabs 推出最具表现力的文字转语音模型:Eleven v3
ElevenLabs推出v3(alpha)文字转语音模型,支持70+语言、多角色自然对话及[whispers][laughs]等音频标签,可精准表达情绪与环境音效;新架构大幅提升上下文理解与语音表现力,但需更精细的提示词引导。
OpenAI 推出软件工程智能体:Codex
OpenAI 在 ChatGPT 中上线 Codex 研究预览版——一款基于云端、由全新 Codex-1 模型驱动的软件工程智能体。它可深度集成 GitHub 仓库,自动解析代码、发现并修复错误、提出优化建议,并完成从问题分析到测试验证的完整开发流程,支持多任务并行与沙盒化执行,现面向 Pro、企业及团队用户开放。
开源 MCP 记忆共享项目:Open Memory MCP
Open Memory MCP 是一个开源本地记忆共享工具,支持 Claude、Cursor 等兼容 MCP 协议的客户端,实现跨工具上下文持久化与协同。所有数据本地存储,保障隐私与可控性;配套可视化仪表板支持记忆级权限管理与实时访问监控,让多智能体协作更透明、更可靠。
免费的长视频转文字博客神器:Video to Blog
Video to Blog 能将长视频或 YouTube 链接自动转为结构清晰、风格统一的博客文章,支持语气/长度/配图定制,一键导出至 WordPress、Medium 等平台,并提供 SEO 优化建议与社交文案生成;新视频发布后还可自动同步生成草稿,大幅提升内容复用效率。