【AI】Qwen开源版Banana来了!原生支持ControlNet

人工智能产业链union 2025-09-29 14:55
【AI】Qwen开源版Banana来了!原生支持ControlNet图1

Qwen版Banana来了!

刚刚,Qwen推出了新图像编辑模型——Qwen-Image-Edit-2509。

不仅支持多图融合,提供“人物+人物”,“人物+商品”,“人物+场景” 等多种玩法,还增强了人物、商品、文字等单图一致性

【AI】Qwen开源版Banana来了!原生支持ControlNet图2

除此之外,它还原生支持ControlNet,可通过关键点图改变人物姿势,还可轻松实现换装需求。

图像编辑之余,Qwen还开源了端到端全模态模型Qwen3-omni,表现也可圈可点。既可当语音翻译助手,还能立不同的人设,甚至支持方言输出。

下面具体来看。

支持多图输入

新图像编辑的首要更新就是支持了多图输入

先看一个“人物+人物”生成结婚照的例子。

输入两张图片:

【AI】Qwen开源版Banana来了!原生支持ControlNet图3

然后,输入以下提示词:

【AI】Qwen开源版Banana来了!原生支持ControlNet图4

结果闪亮登场:

【AI】Qwen开源版Banana来了!原生支持ControlNet图5

不喜欢中式婚礼的也没事,我们还可以生成西式的,主打一个用户就是上帝。

【AI】Qwen开源版Banana来了!原生支持ControlNet图6

再看“人物+场景”的应用,感觉可轻轻松松实现环球旅行。

【AI】Qwen开源版Banana来了!原生支持ControlNet图7

令我比较惊讶的是,这还真不是简单的图像拼接,它甚至贴合场景改变了主角的神态,闭眼享受阳光的动作、躺椅上的影子,说实话,p图我都p不出来这么细。

下面轮到“人物+物体”了,我把它称为最快拥有奢侈品包包和豪车的方式。

【AI】Qwen开源版Banana来了!原生支持ControlNet图8

此外,多图输入也支持ControlNet常用的关键点图,比如改变人物姿势。

【AI】Qwen开源版Banana来了!原生支持ControlNet图9

还能在改变关键点的同时,进行换装。

【AI】Qwen开源版Banana来了!原生支持ControlNet图10

除此之外,普通证件照、形象照、生活照也是so easy。

【AI】Qwen开源版Banana来了!原生支持ControlNet图11

想要Banana大火的美式精英风?无论是半身还是全身照,你想要的Qwen都有。

【AI】Qwen开源版Banana来了!原生支持ControlNet图12

还能进行不同的姿势编辑,俏皮、比心、举黑板都是不在话下。

【AI】Qwen开源版Banana来了!原生支持ControlNet图13

基于新模型上述图像编辑能力,再加上其本身特色的文字生成能力,团队发现它还很擅长制作表情包。

【AI】Qwen开源版Banana来了!原生支持ControlNet图14

当然,对于更长的文字,新模型也依然可以在保持人物一致性的前提下进行渲染。

【AI】Qwen开源版Banana来了!原生支持ControlNet图15

更有意思的是,它还可以给老照片进行修复,比如给照片上色。

【AI】Qwen开源版Banana来了!原生支持ControlNet图16

还可以修复破损照片。

【AI】Qwen开源版Banana来了!原生支持ControlNet图17

但是,这个美颜……

除了真实人物,生成卡通玩偶、文创也是分分钟的事啦。

【AI】Qwen开源版Banana来了!原生支持ControlNet图18

咦?这左下角不就是Nano Banana爆火的手办吗?Qwen新模型效果看起来也是很不错的。

1个物品太简单了,咱们再换个有14只猫的图片试一下。

【AI】Qwen开源版Banana来了!原生支持ControlNet图19

哇哦,猫的数量是对的,效果也是相当可以。

除了图像方面,新模型还专门增强了文字一致性,支持了包括字体类型编辑、字体颜色编辑和字体材质编辑。

【AI】Qwen开源版Banana来了!原生支持ControlNet图20

此外,它还支持定点文字编辑,细致到可将圈出来的错字进行定点修改。

效果是这样滴:

【AI】Qwen开源版Banana来了!原生支持ControlNet图21

不仅如此,新模型还支持深度图控制,保持物体与场景的一致性。

【AI】Qwen开源版Banana来了!原生支持ControlNet图22

哎呀,这泥泞的道路、茂盛的丛林、真实的车辙印,真的不是户外山地车的广告吗?

只有关键点也不耽误出图,无论男女、无论古代还是现代、无论什么穿着,Qwen都能统统搞定。

【AI】Qwen开源版Banana来了!原生支持ControlNet图23

最后就是根据草图来控制生图,这一老一少真给人一种时光穿梭的感觉,再配个bgm氛围感直接拉满。

【AI】Qwen开源版Banana来了!原生支持ControlNet图24

还有端到端全模态模型

Qwen不仅在图像编辑上表现优异,它还开源了端到端、全模态大模型Qwen3-omni,不仅能够无缝处理文本、音频、图像和视频等多种输入形式,还能边生成文字边实时合成语音。

【AI】Qwen开源版Banana来了!原生支持ControlNet图25

主要特点如下所示:

跨模态的领先性能:在36项音频及音视频基准测试中,Qwen3-omni斩获32项开源SOTA与22项总体SOTA,超越Gemini-2.5-Pro、Seed-ASR、GPT-4o-Transcribe等闭源强模型,同时其图像和文本性能也在同尺寸模型中达到SOTA水平。

【AI】Qwen开源版Banana来了!原生支持ControlNet图26

多语言方面:Qwen3-omni支持119种文本语言、19种语音输入语言和10种语音输出语言。

效果be like:


不仅是实时翻译助手,还能直接总结网页内容,然后用你所需要的语言输出。

更快响应:端到端音频对话延迟低至211ms,视频对话延迟低至507ms。

长音频:支持长达30分钟音频理解。


个性化:支持system prompt随意定制,可以修改回复风格,人设等。

比如广东幼儿园老师或是四川女汉子。


咦,那么问题来了,这些方言是否标准噻?

工具调用:支持function call,实现与外部工具/服务的高效集成。

开源通用音频Captioner:开源Qwen3-Omni-30B-A3B-Captioner,低幻觉且非常详细的通用音频caption模型,填补开源社区空白。


不仅能分析音乐风格,还能推理数学题,甚至还能当起语音助手唤醒其他应用。

这花里胡哨的功能真是令人眼花缭乱,感兴趣的读者赶紧去试试吧。

参考链接:
[1]https://huggingface.co/Qwen/Qwen-Image-Edit-2509
[2]https://qwen.ai/blog?id=7a90090115ee193ce6a7f619522771dd9696dd93&from=research.latest-advancements-list
[3]https://github.com/QwenLM/Qwen3-Omni

一键三连「点赞」「转发」「小心心」

欢迎在评论区留下你的想法!

—  —

 

☟☟☟


精选报告推荐:

11份清华大学的DeepSeek教程,全都给你打包好了,直接领取:




 10份北京大学的DeepSeek教程

8份浙江大学的DeepSeek专题系列教程

4份51CTO的《DeepSeek入门宝典》

5份厦门大学的DeepSeek教程

10份浙江大学的DeepSeek公开课第二季专题系列教程

6份浙江大学的DeepSeek公开课第三季专题系列教程


相关阅读

干货推荐:

AI机器人设计推荐:
RPA 流程自动化系列推荐:
面试推荐:
大模型课程推荐:

人工智能产业链联盟高端社区




【AI】Qwen开源版Banana来了!原生支持ControlNet图27
精选主题推荐:

荐:
【中国风动漫】《姜子牙》刷屏背后,藏着中国动画100年内幕!

【AI】Qwen开源版Banana来了!原生支持ControlNet图28
声明

免责声明:部分文章和信息来源于互联网,不代表本订阅号赞同其观点和对其真实性负责。如转载内容涉及版权等问题,请立即与小编联系(微信号:913572853),我们将迅速采取适当的措施。本订阅号原创内容,转载需授权,并注明作者和出处。如需投稿请与小助理联系(微信号:AI480908961)

编辑:Zero

【AI】Qwen开源版Banana来了!原生支持ControlNet图29


【AI】Qwen开源版Banana来了!原生支持ControlNet图30

【AI】Qwen开源版Banana来了!原生支持ControlNet图31

声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
AI 开源
more
上海AI Lab最新开源!SciReasoner:跨学科科学数据推理的统一基座模型
千里科技AI战略布局完成第一步
实测开源版 nano banana:更聪明的超长文本渲染,彻底告别 AI 汉字鬼画符
充电早报:MagSafe配件匹配全新iPhone Air;深度拆解正浩移动电源;拆解2款康舒服务器电源,功率分级适配AI算力场景
【精选报告】红杉AI崛起2025主题演讲:人工智能万亿美元机遇(附PDF下载)
用AI,学一门2000万人在用的“外语”
【AI】Qwen开源版Banana来了!原生支持ControlNet
Seko AI 想要重新定义短片创作这件事
【报告】2025年软件技术年报STAR-十大AI关键技术与趋势(附PDF下载)
Future Tech | 赶快,AI职通车即刻出发!优质AI岗位手慢无
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号