Nano Banana!Gemini 的图片编辑功能迎来重大升级
Gemini 推出全新图片编辑模型 Nano Banana,显著提升人物特征一致性,支持换装、换景、多图合成、多轮编辑与风格迁移。免费用户可用,所有生成图均带可见水印及 SynthID 隐形水印,兼顾创意自由与内容可追溯性。
Google 图像模型 Gemini 2.5 Flash Image 介绍
Google 推出 Gemini 2.5 Flash Image(nano-banana),支持多图融合、角色一致性保持、自然语言精准编辑及基于世界知识的语义理解,已在 Gemini API、AI Studio 和 Vertex AI 开放预览,定价约 0.039 美元/张,附带 SynthID 水印。
Gemini 图像生成:如何写出有效的提示词
Gemini 图像生成(Imagen 4)与编辑(Nano Banana)支持角色一致、多元素融合、局部修改、风格迁移及逻辑推理。高效提示词需涵盖主体、构图、动作、地点、风格和编辑说明六大要素,适用于创意设计、产品优化与内容创作等实际场景。
ElevenLabs Eleven Music 最佳提示指南
Eleven Music 模型支持用自然语言生成高质量定制音乐。本指南详解如何通过流派情绪、乐器/人声关键词(如“solo”“a cappella”)、BPM与调性、时长控制及多语言歌词等提示技巧,精准引导输出——从游戏配乐到广告音频,一句描述即可启动创作。
OpenAI 正式发布了两款开放权重大型语言模型
OpenAI 五年来首次开放模型权重,发布 gpt-oss-120b 与 gpt-oss-20b 两款 MoE 架构大模型,支持代码生成、数学推理等任务;前者可在单卡 GPU 运行,后者适配笔记本;Apache 2.0 开源,已上线 Amazon Bedrock 与 SageMaker。
打造虚拟模特极简工作流
MayorkingAI 提出三步极简虚拟模特工作流:先用 Flux 生成 A 姿白底模特图;再用 Flux.1 Kontext 等工具将原服装替换为自定义服饰图;最后通过可灵或 Veo 3 生成视频。流程轻量、易上手,适合电商上新、品牌广告与虚拟网红内容批量生产,affogato.ai 已集成该方案。
10 组让 AI 图像更具电影感的提示词撰写技巧
NΞXUS STUDIO AI 整理10组提升AI图像电影感的提示词技巧,涵盖焦外虚化、棱镜炫光、Brenizer法、红外胶片模拟等专业摄影手法,每组均提供基础与升级写法,并说明适用风格与视觉价值,助你生成更具叙事性、质感和 cinematic 氛围的AI影像。
IBM 联合 O’Reilly 推出免费电子书《解锁 AI 价值创造》
IBM与O’Reilly联合发布免费电子书《解锁AI价值创造》,聚焦AI如何切实驱动增长与创新。书中整合跨行业真实案例、落地策略、伦理与运营挑战应对方案,以及AI融入企业战略和文化的实操建议,为企业提供可借鉴的AI价值实现路径。
AI 流利性框架基础课程 第十一课:课程总结
AI流利性框架提出“委托、描述、分辨、尽责”四项核心能力,对应自动化、增强、代理三种人机协作模式,强调任务分配合理性、意图传达准确性、结果评估批判性与伦理责任全程性,助力用户在真实场景中提升AI应用实效与责任感。