Gemini桌面客户端终于上线:直接读取屏幕上下文,帮你解读一切!

新智元 2026-04-17 00:23

Gemini桌面客户端终于上线:直接读取屏幕上下文,帮你解读一切!图1



  新智元报道  

编辑:艾伦
【新智元导读】Gemini 终于推出桌面客户端了!除了能做网页端的一切,它的杀手锏是能捕捉屏幕上所有窗口,突破浏览器限制,把一切都装进模型上下文,帮你解读一切。

这两年只要聊桌面 AI 助手,大家脑子里先跳出来的,基本都是 ChatGPT 和 Claude。

前者早早把客户端铺进 Mac,后者也早就把桌面入口做出来了。

结果谷歌这边,Gemini 一直挂在网页里,多少有点拧巴。

模型声量很大,桌面存在感却一直差口气。

现在,这个坑终于补上了。

谷歌正式推出 Gemini 的 macOS 原生客户端,支持全局快捷键拉起,也能直接共享当前窗口。

Gemini桌面客户端终于上线:直接读取屏幕上下文,帮你解读一切!图2

https://gemini.google/mac/

这件事其实分量很重。

因为网页端再强,终究还是网页端。

你得先开浏览器,找到那个标签页,切进去,问完,再切出来。

整个过程是破碎的,像是临时找人帮个忙。

客户端不一样,它会一直贴在桌面边上,像一个随时能被叫出来的桌宠。

只要这个入口真的常驻,Gemini 后面才有机会突破浏览器的壳,去碰文档,碰表格,碰代码窗口,碰你当下正在处理的那堆东西。

很多朋友可能会觉得,不就是多了个 App 吗,有这么夸张吗。

还真有。

因为今天大家争的早就不是谁会聊天,谁会写个邮件,谁能做总结。

大家争的是谁能离工作流更近,谁能更像一个一直在屏幕边上待命的助手。

Gemini 现在终于也坐到这张桌子上了。

Gemini桌面客户端终于上线:直接读取屏幕上下文,帮你解读一切!图3
官方到底发了啥,亮点在哪

先看官方公告。

第一,Gemini Mac 版是原生客户端,不是网页壳套个桌面图标糊弄一下。

谷歌官方说,这是原生 macOS 体验。

Gemini 产品负责人 Josh Woodward 也在 X 上透露:一个小团队,不到 100 天,做了 100 多个功能,还是 100% 原生 Swift。

Gemini桌面客户端终于上线:直接读取屏幕上下文,帮你解读一切!图4

https://x.com/joshwoodward/status/2044452201947627709

这个表态挺有意思,潜台词很明显,谷歌知道大家对桌面端这件事已经催很久了,所以这次要先把使用体验等基本盘给稳住。

第二,Gemini 终于能从任何界面被叫出来了。

Option + Space,直接拉起迷你聊天窗口。

Gemini桌面客户端终于上线:直接读取屏幕上下文,帮你解读一切!图5

Option + Shift + Space,进入完整聊天界面。

Gemini桌面客户端终于上线:直接读取屏幕上下文,帮你解读一切!图6
Gemini桌面客户端终于上线:直接读取屏幕上下文,帮你解读一切!图7

浅色主题挺漂亮的,深色主题也相比网页端更惊艳了,背景从灰色变成纯黑色。

Gemini桌面客户端终于上线:直接读取屏幕上下文,帮你解读一切!图8

客户端

Gemini桌面客户端终于上线:直接读取屏幕上下文,帮你解读一切!图9

网页端

这个设计有点像把 Gemini 塞进了苹果搜索 Spotlight 那个位置。

你在写方案也好,看财报也好,做表格也好,脑子里突然卡一下,想问个日期、公式、思路、翻译、灵感,手不用离开当前工作区太远,Gemini 就弹出来了。

这种低摩擦感,往往比模型参数更能决定一个产品会不会被高频使用。

第三,也是这次最关键的一点,Gemini 可以直接看你正在看的东西了。

官方给了窗口共享功能。

Gemini桌面客户端终于上线:直接读取屏幕上下文,帮你解读一切!图10

需要先授予客户端所需的两个权限。

Gemini桌面客户端终于上线:直接读取屏幕上下文,帮你解读一切!图11

你可以把某个窗口分享给 Gemini,它就能基于眼前这块内容给反馈。

Gemini桌面客户端终于上线:直接读取屏幕上下文,帮你解读一切!图12

被分享的 ChatGPT 窗口

Gemini桌面客户端终于上线:直接读取屏幕上下文,帮你解读一切!图13

Gemini 对被分享的窗口的解读

看一张复杂图表,问它这三个最大结论是什么。

盯着一段代码,问它这里可能哪里有坑。

开着一个文档,直接让它提炼重点。

看一段视频,让它总结视频要点。

Gemini桌面客户端终于上线:直接读取屏幕上下文,帮你解读一切!图14

这个动作一旦成立,整个交互逻辑就变了。

过去是你把上下文搬给 AI,现在是 AI 开始主动触及到上下文。

这个变化的影响很大。

再顺着往下看,官方落地页还提到几个细节。

支持所有 Gemini 支持的语言和国家地区;免费提供;要求 macOS 15 及以上;只支持 Apple M 系列芯片;同账号下的聊天记录和记忆可以同步。

网页端能做的,Gemini 客户端统统能做。

这次不是单纯给网页端装了个壳,更像是把 Gemini 整套能力重新嵌进 Mac 工作流。

回到普通用户这边,这些信息最后会落到一个特别朴素的体验上。

少切一次网页、少找一次标签页、少复制一次截图和内容、少打几句前情提要。

你别小看这几个「少」字,很多产品最后能不能留下来,就差在这里。

Gemini桌面客户端终于上线:直接读取屏幕上下文,帮你解读一切!图15
看起来很美
但 Gemini 离真正的助手还差一点

当然,聊到这里,得泼一点冷水。

这次 Gemini 上 Mac,肯定是好事,而且是迟早要发生的事。

可如果把它放进今天这场桌面 AI 混战里看,现在这版 Gemini,更像一个终于学会常驻桌面的聊天助手,一个更快、更顺手、能看屏幕内容的入口层。

它很重要,但还没有进化到 Claude 和 ChatGPT 那种让人一拍大腿的程度。

差在哪?

差在 Computer Use(电脑操作)这口气还没续上。

Gemini 已经嵌入 Chrome 浏览器并默认开启,读取网页上下文没有问题了。

Gemini桌面客户端终于上线:直接读取屏幕上下文,帮你解读一切!图16

Gemini Mac 版现在能做的是从任何界面拉起、共享窗口、基于上下文回答问题,但 Claude 和 ChatGPT 的 Mac 体验早就已经在往更深的电脑操作能力走了。

Gemini 已经从浏览器里走出来了,但离真正能帮你在电脑上连续干活,还差一段路。

这段路很关键。

因为桌面 AI 走到最后,拼的绝对不只是悬浮窗做得漂不漂亮,快捷键顺不顺手。

拼的是它能不能真的读懂你的屏幕,理解你在干嘛,然后跨多个 App 去主动接活,去执行,去把一连串动作串起来。

今天的 Gemini,已经摸到了门把手。

Claude 和 ChatGPT,已经把门推开了一点。

Gemini 后面大概率也会补上这一块的能力。

谷歌官方博客自己都说了,首发版只是开始,接下来几个月还会有更多消息。

窗口共享是第一层,全局快捷键是第二层,跨 App 理解和执行是第三层。

现在谷歌总算把前两层搭起来了。

剩下那层最香的,估计还得等等。

总之,Gemini,总算住进 Mac 了。

参考资料:
https://blog.google/innovation-and-ai/products/gemini-app/gemini-app-now-on-mac-os/
https://gemini.google/mac/

秒追ASI
⭐点赞、转发、在看一键三连⭐
点亮星标,锁定新智元极速推送!

Gemini桌面客户端终于上线:直接读取屏幕上下文,帮你解读一切!图17
Gemini桌面客户端终于上线:直接读取屏幕上下文,帮你解读一切!图18

声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
EMI
more
倒反天罡!Gemini Flash表现超越Pro,“帕累托前沿已经反转了”
我愿将免费的Gemini3 Flash,称为谷歌的无解阳谋。
谷歌推Gemini免费SAT模考服务,AI教育再掀变革浪潮
Altman怒喷OpenAI唱衰者;小鹏发布人形机器人IRON;苹果支付10亿美金,新Siri将引入谷歌Gemini|极客早知道
内测输给Gemini,还套壳?!Meta千亿自研大模型遭延期
Gemini 3 Flash闪电来袭:智力竟反超Pro!速度快3倍,全球免费
谷歌地图推Gemini驱动“Ask Maps”与沉浸式导航新体验
年度最强AI压轴!谷歌Gemini 3.0下周决战OpenAI,前端要下岗了
华尔街彻夜难眠!Gemini 3屠榜金融「最难考试」,AI砸了「金饭碗」?
DeepSeek的小更新,暴打了OpenAI,追上了Gemini。
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号