最近,nano banana 火到不行,成了大家的 AI 玩具工厂。只要给他一句提示,随便上传一张照片,它就能生成一个真实的桌面手办,桌子上还有一个包装盒子,一台显示着 3D 建模的电脑。很多人第一次看到 nano banana 生成的桌面手办图片时,大概都会想问「这手办是哪里可以做?」过去,答案是「做不了也买不到,是 AI 画的」。现在,这个手办,真的能被打印出来,送到你的桌面上。腾讯混元 3D 发布了全新 3.0 版本,带来了更丰富的细节和更真实的质感,我们的创意可以不用停留在文字、图片或视频,而是现实世界里,能够摸得着的物理实体。相比前代 V2.5,3.0 版本在三个方面有了巨大升级:人物生成质量:这是本次最大的亮点。针对人物生成进行了专项优化,精度直接翻了三倍,V2.5 那种抽象脸彻底消失,现在的模型已经逼近真人手办级别。技术规格:首创了 3D-DiT 分级雕刻模型,支持高达 36 亿体素的超高清建模,能更好地兼顾模型的整体结构与局部细节。综合能力:对于复杂几何结构,和不可见区域的还原能力更强,并且纹理的遵循度,和几何对齐精度也得到了进一步优化。一张图片就是一个 3D 物体既然手办能力是核心升级方向,我们这里先拿一张小草神的立绘,直接把它放到腾讯混元的图生 3D,和 Gemini 里面的 nano banana 模型,让它生成一张「定妆照」和一个真实的模型。上传图片,使用腾讯混元 3D-V3.0 生成的模型。还是忍不住感叹一句 nano banana 的强大,我的提示词里面根本没有提到,原神之类的词语,但它生成的盒子包装,有着很明显的原神 logo,和小草神的名字纳西妲(Nahida)。混元 3D 3.0 也没有让我失望,小草神的表情、各种颜色的搭配,以及对上传图片的动作姿态还原,都非常高。拿张罗小黑的电影海报,一样是先让 nano banana 看看,它生成的桌面手办是什么样子。nano banana 发挥依旧稳定,把文字,人物的样子都做到了高度一致,让这个手办显得很真实。而这是混元 3D 生成的模型,还原度非常高。这里也体现了生图和生3D模型的根本区别:Nano banana 理解的是「生成一张手办图」的场景指令,所以它会补全人物和背景。而混元3D理解的是「将这张图复刻成3D模型」的重建指令,所以它严格忠于原图内容,且不支持我们再输入提示词。目前的混元图生 3D 页面,有提示对输入图片的要求。例如,背景简单,最好是纯色背景、不包含文字、单个主体、以及主体不要过小。这个时候的邪修玩法是,可以先让 nano banana 为我们编辑一个,符合图生 3D 的图片,有干净的背景、明确的主体、完整的人物。Nano banana 生成的补全图(左),混元 3D 3.0 生成的模型(右)这下终于得到了一个完整的人物手办,虽然因为图片信息的限制,罗小黑在师傅怀里的细节略显模糊,但整体形态已经非常完整。游戏或动漫角色的纹理,远没有真人复杂。我们还从 unsplash 上找了一张,像是我们日常的人像街拍图片,进行测试。衣服的褶皱,纹理和结构都有做到,但是想要头发、以及衣服材质这些细节,也保持一致,显然是太为难。继续尝试使用 nano banana 去掉背景,展示完整的人物,混元 3D V3.0 生成的效果明显要更好。V2.5 的人脸看着就很抽象,没有太多的真实感和美观度。从左至右,V3.0 生成的 3D 模型,V2.5 生成的 3D 模型,输入的照片(由 nano banana 生成)在我的体验过程中,对比 V2.5,V3.0 最明显的提升,就是看到生成页面左侧,面数从最高 50 万扩展到了 150 万。而面数增加,通俗来讲,带来最直接的变化,就是能对更复杂的物体,实现更高精度的建模,让人物生成效果得到大幅提升。向左滑动查看更多内容,V2.5(左,46.4 MB)眼睛部分比较乱,衣服整体也不如 V3.0(右,143.1 MB)流畅。因为面数的增加,V3.0 的文件大小,更是 V2.5 的三倍之大。除了单图,腾讯混元还提供了正视图、后视图、以及左右视图,多张图片上传生成 3D 模型的功能。我们可以把自己手边的任何物品,拍摄 2-4 张图片,正视图是必须要有,然后上传到混元 3D 生成平台,就能得到一个精准复刻的虚拟分身。依次是正视图、右视图、和后视图,图片来源:https://www.popmart.com/us/products/878/THE-MONSTERS---I-FOUND-YOU-Vinyl-Face-Doll手办自由,真不是混元 3D 一句随随便便的口号。没有左右视图,也可以直接用 nano banana 生成,一张哈利波特骑着扫帚的图片,然后要求 nano banana 生成左右视图和后视图。原图(第一张),后面几张由 nano banana 生成输入到混元 3D 的多图生成,我们就能得到一个哈利波特 3D 模型手办。一句话也能让创意来到现实世界如果觉得用 nano banana 来 P 图,或者上传照片太麻烦,我们还可以直接使用文生 3D,一句话就能创建一个 3D 物体。向左滑动查看更多内容,提示词:小孩,圆脸,毛绒衣物,手中拿奶龙玩偶,惊喜,卡通风格(左);青年男子,身材修长,坐在单人沙发上,面前的书桌上放着一份预制菜和一杯果汁,笔记本电脑打开着,桌角有一盆小绿植,人物表情放松,极简风格(右)。中秋节快到了,我们也让它生成几个 3D 月饼,还有前段时间,朋友圈大家都在发的血月。向左滑动查看更多内容人脸雕刻是混元 3D 3.0 的亮点,前面的图生 3D 已经证明了其还原能力。那么它的原创能力如何呢?最近关于预制菜的讨论非常热,我们用混元 3D 的文生 3D,生成了一个西兰花带货主播。而一些简单的角色创建,混元 3D 更是很容易就能做到。向左滑动查看更多内容,提示词:一个留着棕色短发的年轻女/男性上半身。都是红彤彤的脸蛋,但眼睛、眉毛这些细节做的都很好,直接用作动漫电影角色我觉得都可以。因为腾讯混元 3D 模型,生成的内容,是实实在在的 3D 资产,且提供了丰富的下载格式,包括 STL、GLB 等。我们可以从混元的生成页面,下载对应的 3D 文件,导入到其他软件中再处理,或者直接打印出来。淘宝上一些商家有提供打印服务,单价基本上都在 0.5 元/克左右。部分城市或大学图书馆也有提供 3D 打印服务,例如下面是港中深图书馆提供的 3D 打印服务收费标准。60g 材料能打多大?要看你选的填充率。常见的 15%-20% 填充,大概能打一个 10-12 厘米高的动漫角色手办。但是,这些 3D 打印应该都是一种材料,所以最后出来的效果,大概率只是一个模型的几何结构,和网页预览会有差距,后续有上色等操作。白模(左)和纹理(右)区别,由混元 3D 3.0 生成除了 3D 打印,还有游戏开发、动画设计、甚至是有机会融入到,李飞飞最近发布的世界模型成果,可玩性拉满。而为了更好的帮助 3D 设计师、游戏开发者、以及建模师等专业用户,混元 3D 在周五还发布了一站式、专业级 AI 工作台,混元 3D Studio。混元 3D Studio 能帮助用户从最初的概念,到几何设计、纹理编辑、动画特效等 3D 设计全流程,获得极大的效率提升。目前已经开放了申请,加入候补名单就有机会上手体验。混元 3D Studio 申请地址: https://3d.hunyuan.tencent.com/studio体验地址(每天有 20 次免费生成额度):🔗 https://3d.hunyuan.tencent.com/欢迎加入 APPSO AI 社群,一起畅聊 AI 产品,获取#AI有用功,解锁更多 AI 新知👇我们正在招募伙伴📮 简历投递邮箱hr@ifanr.com✉️ 邮件标题「姓名+岗位名称」(请随简历附上项目/作品或相关链接)更多岗位信息请点击这里🔗