再见了，Photoshop！谷歌发布 Gemini 2.5 Flash Image (纳米香蕉)：一句话P图让Adobe彻底沉默

智能情报所 2025-08-27 17:05

资讯配图

谷歌新推出的 Gemini 2.5 Flash 模型代表了图像编辑领域的一大步飞跃。

核心亮点

在多个提示词和多张图片中保持角色的一致性。
使用自然语言进行定向编辑或替换物体。
通过单个提示词将多张图片合成为一张。
在图片内精确渲染文本。
每 100 万输出 token 定价 30 美元（1 张图片 ≈ 1290 token，约合 0.039 美元）。

可用性

您现在就可以在 Google AI Studio 上进行试用。

试用地址：https://aistudio.google.com/app

该模型已部署于 Gemini 应用及开发者平台中。可用范围覆盖 Gemini 应用、Gemini API、Google AI Studio 以及 Vertex AI。其定价为每 100 万输出 token 收费 30.00 美元，每张图片计为 1290 token，换算后约合每张图片 0.039 美元。

功能特性

拥有更佳的视觉质量、更强的指令遵循能力，以及能在编辑过程中保持人脸和物体稳定性的特性。

资讯配图

通过纯文本提示词即可实现定向的局部编辑。例如，移除某个人物、修复污点、模糊背景、改变姿势或为单个物体重新上色，而这一切都不会破坏画面的其余部分。

资讯配图

角色一致性：能够在不同镜头间保持同一个人或产品的稳定性，保留其发型、服装和标志等特征。也就是说，它可以在多张图片中维持一个角色的身份标识，即便改变其服装、姿势和场景，其核心外观也能保持不变。

资讯配图

创意构图：将最多三张不同图片的元素无缝融合成一个统一协调的杰作。这为超现实主义艺术和独特构图创作带来了无限可能。

资讯配图

多图融合功能可以将多个输入合并为一个输出，例如将一盏选定的台灯放入卧室照片中，或者用一套指定的调色板重新设计客厅风格。

资讯配图

模板遵循功能可以为批量生产（如房地产卡片或公司徽章）固定布局，同时替换其中的主体内容。

资讯配图

Gemini 融入了世界知识，这意味着该模型对日常事物有着普遍的理解。因此，它知道什么是沙发、窗户或落地灯，以及它们通常如何组合在一起。
因此，该图像模型能够读取草图或图表，理解物体的语义，并一步到位地遵循复合指令。

也就是说，它可以看懂一张粗略的草图或带有标签的布局图，并判断出哪些形状对应真实物体以及它们应该被放置在什么位置。

这减少了反复调校提示词的繁琐工作，因为模型能够直接响应像“将画面调暗两个色度，并将沙发居中放置在窗下”这样的请求。
该编辑器支持多轮对话，因此您可以通过简短的追问进行迭代式修改。
谷歌在 AI Studio 中增加了构建模式（build mode）的更新，提供了可混合搭配的模板应用，以便进行快速测试、部署或导出代码。
输出的图片带有一个不可见的 SynthID 水印，并添加了元数据标识符以供平台检测。
被禁止的用例包括未经同意的私密图像，而日常的创意编辑功能则保持可用。
像 OpenRouter 这样的合作伙伴将其覆盖范围扩大到超过 300 万开发者，而 fal.ai 则提供了另一条通往生产环境的路径。
开发者应预见到，在早期预览版中可能存在一些弱点，例如在图片上渲染长文本或处理非常精细的真实细节。

下面是一个运行它的简单代码。

资讯配图

在 Artificial Analysis 图像编辑竞技场中，谷歌的 Gemini 2.5 Flash Image (Nano-Banana) 击败了 GPT-4o 和 Qwen-Image-Edit，摘得顶尖图像编辑模型的桂冠！

资讯配图

Gemini-2.5-Flash-Image-Preview (“nano-banana”) 在图像编辑竞技场 (Image Edit Arena) 中排名第一。

资讯配图

一键三连「点赞」「转发」「小心心」

欢迎在评论区留下你的想法！

声明：内容取材于网络，仅代表作者观点，如有内容违规问题，请联系处理。

EMI

more

25999 元，戴尔 16 Premium上市：Ultra 9 285H、RTX 5060、4K 120Hz OLED 触控屏

笔吧评测室 3周前

25999 元，戴尔 16 Premium上市：Ultra 9 285H、RTX 5060、4K 120Hz OLED 触控屏

谷歌推最强Gemini推理模型：月费1800，已拿奥赛金牌，性能超OpenAI o3和Grok 4

智东西 1个月前

谷歌推最强Gemini推理模型：月费1800，已拿奥赛金牌，性能超OpenAI o3和Grok 4

深度研究模式｜ChatGPT、Gemini、Claude大比拼：做深度市场研究，到底谁最强？

智能情报所 2周前

深度研究模式｜ChatGPT、Gemini、Claude大比拼：做深度市场研究，到底谁最强？

AIR 科研｜超越GeminiDiffusion，每秒推理速度2000+tokens，Seed Diffusion发布

清华大学智能产业研究院 4周前

AIR 科研｜超越GeminiDiffusion，每秒推理速度2000+tokens，Seed Diffusion发布

MIRIX重塑AI多模态长期记忆：超Gemini 410%，节省99.9%内存，APP同步上线

机器之心 1个月前

MIRIX重塑AI多模态长期记忆：超Gemini 410%，节省99.9%内存，APP同步上线

9月深圳，SEMI-e深圳国际半导体展暨2025集成电路产业创新展打造30万㎡“半导体+光电子”盛宴

芯榜 6天前

9月深圳，SEMI-e深圳国际半导体展暨2025集成电路产业创新展打造30万㎡“半导体+光电子”盛宴

【技术博客】掌握 PCB 设计中的 EMI 控制之如何设计低 EMI 的 PCB

发烧友研习社 5天前

【技术博客】掌握 PCB 设计中的 EMI 控制之如何设计低 EMI 的 PCB

LLM开源模型大串讲：Gemini 2.5、Voxtral、Magistral、MiMo、Seed等

AI生成未来 1个月前

LLM开源模型大串讲：Gemini 2.5、Voxtral、Magistral、MiMo、Seed等

台积电救场 Tensor，硬件只为 Gemini｜Pixel 10 发布会速览

爱范儿 1周前

台积电救场 Tensor，硬件只为 Gemini｜Pixel 10 发布会速览

【AI】刚刚，马斯克Grok4干翻谷歌Gemini！o3杀入首届大模型对抗赛决战

人工智能产业链union 2周前

【AI】刚刚，马斯克Grok4干翻谷歌Gemini！o3杀入首届大模型对抗赛决战

Copyright © 2025 成都区角科技有限公司

蜀ICP备2025143415号-1

川公网安备51015602001305号