#图像生成
SynCity:开创无需训练的 3D 世界生成新范式
SynCity 是牛津大学提出的一种无需训练的 3D 世界生成方法,通过协同调用预训练的 2D(Flux)与 3D(TRELLIS)模型,以逐块生成、跨维转换和迭代混合的方式,构建连贯可探索的 3D 环境。它绕开传统高成本训练流程,显著提升生成效率与通用性,适用于多样化文本驱动的场景构建。
Google 推出 Gemini 2.0 Flash 原生图像生成功能
Google 正式向所有支持地区开发者开放 Gemini 2.0 Flash 原生图像生成功能,可在 Google AI Studio 和 Gemini API 中调用。它支持文本生成图像、对话式实时编辑、常识推理保障内容合理性,并显著提升图像中文字渲染的准确性,适用于故事配图、广告设计等场景。
如何通过 Gemini 2.0 创作图像小说和电影分镜
Gemini 2.0 已深度集成 Imagen 图像生成能力,支持用自然语言(含中文)连续生成风格、人物、场景一致的分镜图像。Anu Aakash 仅凭情节描述、镜头要求与闪回指令,就高效产出多组电影级分镜,零绘画基础也能完成图像小说与影视前期创作,现通过 Google AI Studio 或 Gemini 免费使用。
NEX 的 Ikon 2 AI 绘画模型击败 Dall·E 3、Flux 等巨头,问鼎 GenEval 排行榜!
NEX 六人团队研发的 Ikon 2 AI 绘画模型,仅用 9 万 GPU 小时、1/6 行业预算,在 GenEval 提示匹配度评测中力压 DALL·E 3、Flux 和 DeepSeek Janus 登顶榜首,以极低成本实现高精度图像生成。
如何使用 FreePik 轻松制作创意广告
FreePik AI 套件让创意广告制作大幅简化:输入文字描述即可生成高质量图像,用内置工具快速优化细节;再通过提示词驱动AI视频模型,生成电影级运镜、光影与动画,搭配音效和音乐,10分钟内完成专业CGI广告。
如何借助 AI 绘画和视频生成技术轻松打造创意广告
FreePik 展示如何用 AI 绘画与视频生成技术,仅凭文本提示即可产出“奶酪倾泻摩天楼”“草莓汽水罐爆裂”等超现实广告素材——静态图电影感十足,动态视频自带手持沉浸感,真实质感与奇幻创意无缝融合,大幅降低创意执行门槛。
如何通过 Grok 3 快速开发一个完整的游戏
技术达人Alvaro Cintas仅用数小时,借助Grok 3从零开发出一款功能完整的竖版跳跃游戏,涵盖角色、怪物、平台、难度与生命系统。他采用“先跑通再美化”策略:首步生成单文件HTML/CSS基础代码(形状代替素材),再用AI批量产出风格统一的视觉资源,最后逐步叠加动画、菜单与敌人等细节。
AI 创意视频:美食成精
AI创意达人TechHalla用Mystic v2.5 Fluid生成超写实图像,再以可灵1.6制成视频,打造“美食成精”系列:香蕉蜥蜴、爆米花猫头鹰、菠萝犰狳、可颂螃蟹等奇幻生物,在复古厨房、热带小屋、巴黎面包店等场景中,以食材质感与动物形态的精妙融合,营造好奇与诡谲交织的视觉体验。
Midjourney 作品整理功能使用教程
Midjourney上线作品整理功能,支持以文件夹(标签)形式对生成图进行分类管理:创建或浏览时自动归入对应文件夹,图片可归属多个文件夹,分组归类更清晰;灯箱中直观展示,右键即可批量下载,拖拽或点击按钮均可快速添加图片。