
【科技24时区】谷歌于本周四正式宣布,其Gemini人工智能助手的“个人智能”(Personal Intelligence)功能将整合Nano Banana图像生成模型,从而实现基于用户个性化上下文的图像创作。这意味着,AI在生成图像时可直接调用用户在Google账户中的行为数据与偏好信息,无需用户在提示词中逐一说明。
该能力的核心在于Gemini已通过Google账户体系打通了包括Gmail邮件、Google Photos相册等多源数据。例如,过去用户若想生成“梦想中的家”,需明确写出“我喜欢网球和音乐”等背景信息;如今只需输入“设计我的梦想家”,系统即可自动提取相关上下文进行创作。
更进一步,Nano Banana还能识别Google Photos中的标签语义。当用户相册中存在名为“Family”(家人)的相册时,Gemini便能理解这一群体的具体成员。用户仅需指令“生成我和家人一起做最喜欢活动的图片”,AI即可准确还原人物关系与场景设定,而无需上传参考图或额外描述。
为提升透明度,谷歌在生成结果中加入了“Sources”(来源)按钮,点击后可查看AI所依据的具体数据来源,如某封邮件主题、某个相册标签等。若生成结果与预期不符,用户可通过反馈按钮即时纠正。此外,用户亦可通过点击“+”图标手动上传参考照片,以增强生成图像的准确性。
据悉,该图像生成功能将在未来几天内面向美国地区的Gemini Plus、Pro及Ultra订阅用户开放。谷歌同时表示,计划“soon”(近期)将此功能扩展至Chrome桌面版及其他地区用户,根据过往惯例,这一时间窗口通常为1至3个月。
值得注意的是,Personal Intelligence功能并非全新推出。谷歌于2026年初首次发布该特性,主打“AI理解用户上下文”;同年3月向全体美国用户开放。本周早些时候,该功能已扩展至印度、日本等市场,旨在验证非英语环境下个人数据的理解与应用能力。此次图像生成能力的接入,标志着Personal Intelligence从文本理解迈向多模态融合的关键一步。