谷歌Gemini个人智能功能接入Nano Banana图像生成,支持基于用户上下文的个性化创作

科技区角 2026-04-17 02:03

【科技24时区】谷歌于本周四正式宣布,其Gemini人工智能助手的“个人智能”(Personal Intelligence)功能将整合Nano Banana图像生成模型,从而实现基于用户个性化上下文的图像创作。这意味着,AI在生成图像时可直接调用用户在Google账户中的行为数据与偏好信息,无需用户在提示词中逐一说明。

该能力的核心在于Gemini已通过Google账户体系打通了包括Gmail邮件、Google Photos相册等多源数据。例如,过去用户若想生成“梦想中的家”,需明确写出“我喜欢网球和音乐”等背景信息;如今只需输入“设计我的梦想家”,系统即可自动提取相关上下文进行创作。

更进一步,Nano Banana还能识别Google Photos中的标签语义。当用户相册中存在名为“Family”(家人)的相册时,Gemini便能理解这一群体的具体成员。用户仅需指令“生成我和家人一起做最喜欢活动的图片”,AI即可准确还原人物关系与场景设定,而无需上传参考图或额外描述。

为提升透明度,谷歌在生成结果中加入了“Sources”(来源)按钮,点击后可查看AI所依据的具体数据来源,如某封邮件主题、某个相册标签等。若生成结果与预期不符,用户可通过反馈按钮即时纠正。此外,用户亦可通过点击“+”图标手动上传参考照片,以增强生成图像的准确性。

据悉,该图像生成功能将在未来几天内面向美国地区的Gemini Plus、Pro及Ultra订阅用户开放。谷歌同时表示,计划“soon”(近期)将此功能扩展至Chrome桌面版及其他地区用户,根据过往惯例,这一时间窗口通常为1至3个月。

值得注意的是,Personal Intelligence功能并非全新推出。谷歌于2026年初首次发布该特性,主打“AI理解用户上下文”;同年3月向全体美国用户开放。本周早些时候,该功能已扩展至印度、日本等市场,旨在验证非英语环境下个人数据的理解与应用能力。此次图像生成能力的接入,标志着Personal Intelligence从文本理解迈向多模态融合的关键一步。

声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
EMI
more
谷歌Gemini月活用户突破7.5亿,AI业务成增长核心引擎
全新OCR将图片变代码无损重绘!华中科大&小红书发布3B模型,图形重建超越Gemini 3 Pro
谷歌Gemini个人智能功能接入Nano Banana图像生成,支持基于用户上下文的个性化创作
又一国产模型黑马出世,追平Gemini 2.5 Pro,空间编辑反超视频模型?
我愿将免费的Gemini3 Flash,称为谷歌的无解阳谋。
特斯拉Semi电动卡车阿拉斯加极寒测试,2026年量产在即
Gemini 3「开眼」像素级操控!谷歌回应DeepSeek-OCR2
英特尔 EMIB 能否替代台积电CoWoS?
2026年semicon:成都迈科&三叠纪展示了AI算力芯片TGV Glass Core 、CPO Interposer等产品
Agent 编程大战升级、Google 地图接入 Gemini|AI 日报
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号