【区角快讯】2026年2月11日,一则看似简单的日常决策问题,意外暴露了当前主流人工智能大模型在常识推理与语境理解上的局限。问题为:“我想洗车,如果我家离洗车店步行仅50米,该开车去还是走路去?”此提问近期在社交平台引发广泛讨论,众多AI系统给出的答案差异显著,甚至出现逻辑矛盾。

腾讯公司公关总监张军在社交媒体上转发该现象并评论称,据传多数AI在此问题上“翻车”。他亲自测试了腾讯自研的“元宝”模型,初始回复显示模型并非无法理解问题本质,而是对提问方式敏感。经调整提示词(prompt)后,回答明显更趋合理。张军由此感叹,这或许标志着人机交互正进入一种新型“互相驯化”阶段。
此前已有网友实测多款国内外主流大模型的表现。其中,ChatGPT、通义千问、DeepSeek及Kimi均建议用户步行前往,理由集中于距离极近、环保节能、避免停车麻烦等。谷歌Gemini 3则采取折中策略,提出两种情境:若目的是实际洗车,则应开车;若仅为预约或咨询,且车辆不便移动,则可步行。
相较之下,马斯克旗下xAI团队开发的Grok模型回应最为直截了当:“当然开车去!”其核心逻辑清晰——车辆需被送至洗车店才能清洗,“难道让店员隔空洗车?”结尾更带调侃意味地提醒用户:“别让AI把你忽悠成步行党了。”
这一事件折射出当前大模型在处理现实世界常识任务时仍存在语义理解与场景建模的盲区。随着AI深度融入日常生活,如何提升其对人类行为逻辑的准确把握,已成为技术演进的关键课题。