50米洗车该走还是开?AI集体“翻车”引热议,人机交互逻辑再受考验

科技区角 2026-02-11 15:01

【区角快讯】2026年2月11日,一则看似简单的日常决策问题,意外暴露了当前主流人工智能大模型在常识推理与语境理解上的局限。问题为:“我想洗车,如果我家离洗车店步行仅50米,该开车去还是走路去?”此提问近期在社交平台引发广泛讨论,众多AI系统给出的答案差异显著,甚至出现逻辑矛盾。



腾讯公司公关总监张军在社交媒体上转发该现象并评论称,据传多数AI在此问题上“翻车”。他亲自测试了腾讯自研的“元宝”模型,初始回复显示模型并非无法理解问题本质,而是对提问方式敏感。经调整提示词(prompt)后,回答明显更趋合理。张军由此感叹,这或许标志着人机交互正进入一种新型“互相驯化”阶段。

此前已有网友实测多款国内外主流大模型的表现。其中,ChatGPT、通义千问、DeepSeek及Kimi均建议用户步行前往,理由集中于距离极近、环保节能、避免停车麻烦等。谷歌Gemini 3则采取折中策略,提出两种情境:若目的是实际洗车,则应开车;若仅为预约或咨询,且车辆不便移动,则可步行。

相较之下,马斯克旗下xAI团队开发的Grok模型回应最为直截了当:“当然开车去!”其核心逻辑清晰——车辆需被送至洗车店才能清洗,“难道让店员隔空洗车?”结尾更带调侃意味地提醒用户:“别让AI把你忽悠成步行党了。”

这一事件折射出当前大模型在处理现实世界常识任务时仍存在语义理解与场景建模的盲区。随着AI深度融入日常生活,如何提升其对人类行为逻辑的准确把握,已成为技术演进的关键课题。

声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
AI 人机交互
more
Seedance 2.0火爆全网,黑神话之父冯骥:地表最强没有之一/最便宜MacBook有望配备非刘海屏/OpenAI辟谣:被泄露的AI硬件是假的
编程AI变天了!实测神秘模型Pony Alpha:Opus级智能,架构师思维上线
三星HBM4即将量产,抢攻英伟达下一代AI芯片订单
众筹百万美金的AI手机进入中国,小屏幕能否撕开内卷缺口?
夸克AI眼镜S1推1.5.1版本升级,强化第一视角交互与影像能力
爱芯元智登陆港交所 成中国边缘AI芯片第一股
AI生成PPT火了一年,为什么你还是不敢用它做年终汇报?
杭州再出黑马,中国千亿市场被炸穿!AI「杀死」会计,达摩院大佬出手了
5亿买一个域名,这个币圈狠人,想让你60秒拥有自己的AI贾维斯
独立AI入口,真的是最优选吗?
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号