
AlphaSense: 《人工智能的未来:2025年上半年行业发展回顾》
(完整版.pdf ) 以下仅展示部分内容
下载方式见文末
一、引言
2025 年上半年,生成式人工智能(genAI)领域发生显著变革。既有头部企业巩固市场地位,也有新入局者打破行业格局。这一时期,模型架构创新迅猛,尤其在推理能力方面成果突出,同时基础设施投资加码,行业竞争态势不断变化。对智能体(agentic)系统的战略布局正重塑 genAI 在各行业的应用模式,一波并购浪潮也加剧了企业在 genAI 技术栈构建与掌控上的竞争。
二、模型进展
2025 年上半年,多款模型的发布凭借强化的推理与多模态能力,重塑了行业竞争格局,主流玩家与新兴势力各有突破与挑战。
(一)海外头部企业动态
- OpenAI
:3 月推出文本转图像生成器,能精准遵循复杂指令生成高质量视觉内容,同月完成 400 亿美元融资,创下私营科技公司融资纪录。但发展并非一帆风顺,2 月末推出 Orion 模型并将其命名为 GPT4.5,未如预期发布 GPT 5;4 月因 GPT-4o 更新后出现 “谄媚且令人反感” 的问题,不得不回滚更新。5 月宣布收购代码辅助初创公司 Windsurf(约 30 亿美元)和 iPhone 设计师乔尼・艾夫创办的 IO 公司(65 亿美元),分别旨在强化开发者导向的 genAI 产品布局与打造 AGI 时代新产品线。 - 谷歌
:3 月发布 Gemini 2.5 Pro,在编码、数学和推理基准测试中表现优异,具备网络查询能力且训练数据更新至 2025 年 1 月末。4 月推出 Gemini 2.5 Flash 混合推理模型预览版,这是谷歌首款全混合推理模型,允许开发者开启或关闭推理功能。5 月发布最新 AI 视频生成器 Veo 3,以逼真效果获关注,可生成对话、配乐和音效,仅向每月 249 美元的 AI Ultra 计划订阅用户开放;同月宣布以 320 亿美元收购网络安全公司 Wiz,强化 genAI 基础设施安全性。 - Anthropic
:2 月推出 Claude 3.7 Sonnet,成为行业首款混合推理模型,用户可针对任意查询选择标准响应或推理响应,为模型灵活性树立新标杆。5 月发布 Claude 4 系列首批模型,其中 Claude 4 Opus 主打编码能力。但据 5 月报告显示,1 月至 5 月间 Anthropic 的 Claude 模型查询量下降 10%。此外,5 月与微软达成合作,其 Claude 4 模型将为微软 AI 智能体功能提供支持。 - 微软
:上半年巩固了在 genAI 领域的领先地位,Copilot 套件成为其 AI 战略核心,新增记忆功能以实现个性化体验,以及 “Actions” 功能可自主完成预订旅行、管理日程等多步骤任务。在 Microsoft 365 中推出 “Researcher”“Analyst” 等 AI 智能体,助力数据分析与报告生成。5 月初发布 Phi-4-reasoningplus 开源语言模型,虽规模不大,但在多项基准测试中性能优于 DeepSeek-R1-Distill-70B 等更大规模的开源模型。同时宣布计划投资 80 亿美元建设 AI 数据中心,CEO 萨提亚・纳德拉称该数据中心网络为 “可灵活调配的集群”,可在模型训练、运行及全球部署间切换。 - xAI
:2 月推出 Grok 3,具备先进推理能力;4 月为 Grok 整合多模态功能,新增通过智能手机摄像头实现实时视觉分析的 Grok Vision,用户可对准物体提问。 - Meta
:4 月推出独立 AI 应用,与 ChatGPT 应用类似,但特色在于可访问用户在 Facebook、Instagram 等 Meta 平台共享的数据,不过推出时间远晚于竞争对手。原计划 4 月推出的 Llama 4 Behemoth 模型延期至至少秋季。1 月宣布计划截至 2025 年底投入至多 650 亿美元扩建 AI 基础设施。 - Cohere
:2024 年营收远未达预期,缺口达 85%,归因于对企业 AI 采用速度过度乐观及商业 AI 工具市场增长慢于消费市场。但 2025 年初至 5 月,受监管行业企业对安全定制化 AI 工具需求增长推动,年化营收翻倍至超 1 亿美元。
(二)中国企业表现
中国 AI 初创公司 DeepSeek 1 月因开源 R1 大语言模型引发关注,该模型在行业基准测试中性能堪比顶尖 LLM,而训练成本不足 600 万美元,仅为同类模型的一小部分。但 5 月报告显示,其 R1 查询量从 2 月中旬的 7% 降至 4 月末的 3%。
三、新增与强化的能力
随着模型性能提升,genAI 涌现出诸多新能力,拓展了应用边界,改变了模型处理任务的方式、响应模式及与工作流的融合程度。
(一)深度研究能力
谷歌、OpenAI、Perplexity、微软、AlphaSense 等企业在上半年推出深度研究功能,可通过单一提示生成结构化、有来源支撑的报告。这类系统超越简单问答,将复杂查询拆解为多步骤流程,跨多来源检索并整合信息,且注重透明度,不仅提供引用,还解释推理过程,部分支持用户调整底层假设。
(二)智能体(Agentic)AI 发展
2025 年被预测为 AI 智能体元年,上半年已有诸多实践落地。1 月,OpenAI 推出 Operator 智能体,可借助自身浏览器执行任务,目前仅向每月 200 美元的 ChatGPT Pro 订阅用户开放;3 月,亚马逊推出类似通用 AI 智能体 Nova Act,能控制网页浏览器自主执行简单操作(Anthropic 同类智能体 Computer Use 于去年发布)。中国初创公司 “蝴蝶效应” 3 月推出 Manus,号称全球首个通用 AI 智能体,整合 Anthropic 的 Claude 3.5 Sonnet、阿里开源 Qwen 微调版等多模型及多个独立运行智能体,可自主处理复杂线上任务,宣称在通用 AI 助手基准测试中优于 OpenAI 的深度研究功能,但早期用户发现其存在部分错误。5 月,谷歌 DeepMind 发布 AlphaEvolve,这是基于 Gemini 的编码智能体,可优化算法,例如为训练 Gemini 模型的矩阵乘法内核提速 23%,使 Gemini 训练时间缩短 1%。
(三)推理与推理时扩展
推理模型成为行业竞争新焦点与差异化关键。OpenAI 的 o1/o3 模型及 DeepSeek 的 R1 开创了新范式,即在推理时而非仅训练时扩展计算。DeepSeek 的崛起打破市场格局,其创新工程方法引发 1 月末美国 AI 相关股票暴跌,专家认为 DS-R1 以有限算力训练出高性能 LLM,或降低小型 LLM 企业与应用开发者的准入门槛。此外,上半年还出现 Anthropic 的 Claude 3.7 Sonnet、谷歌的 Gemini 2.5 Flash 等混合推理模型,阿里 4 月也推出 Qwen3 混合 AI 推理模型家族。
(四)长期记忆能力
长期记忆成为新兴能力,使 genAI 能跨会话保留上下文,实现更具个性化的持续交互。4 月,微软在 Copilot 套件中加入记忆功能,可跨对话记住用户偏好与细节;OpenAI 向付费用户为 ChatGPT 推出记忆功能,能回忆用户相关信息并保持响应一致性,同时提供查看、删除或关闭记忆的控制选项。xAI 的 Grok 随后跟进类似升级,Anthropic 5 月发布的 Claude 4 系列及谷歌 2 月针对 Gemini Advanced 用户也均更新了长期记忆功能。
四、战略基础设施投资
genAI 的快速发展使基础设施成为核心竞争战场,企业通过加大投资、搭建专业平台、建立战略合作巩固在 AI 经济中的地位。
(一)基础设施投资加码
1 月,OpenAI 宣布 “星门计划”(Stargate Project),成立合资公司计划未来四年投资 5000 亿美元在美国建设新 AI 基础设施,5 月宣布与阿联酋合作建设 Stargate UAE,为该计划首个国际部署项目,彰显算力可用性对 genAI 未来的重要性。Meta 1 月透露计划截至 2025 年底投入至多 650 亿美元扩建 AI 基础设施。
(二)“新云”(Neoclouds)崛起
专注于 AI 原生基础设施的 “新云” 提供商兴起,如 CoreWeave、Lambda Labs、Voltage Park 等,它们专攻 GPU 密集型、AI 优化的基础设施,专为 LLM 训练与部署设计。3 月,CoreWeave 上市,成为 2021 年以来美国最大规模的风投支持科技公司 IPO,标志市场对 AI 技术栈这一新层级的认可与重视。同月,AlphaSense 宣布与 Cerebras 合作,为商业与金融专业人士提供 10 倍速的洞察服务。
(三)并购重塑行业格局
2025 年初的 genAI 热潮推动了战略并购浪潮,企业争相构建涵盖基础设施、工具与企业应用的端到端 AI 能力。4 月,英伟达以超 3.2 亿美元收购合成数据生成公司 Gretel,以应对 AI 模型高质量训练数据需求增长。5 月,CoreWeave 以 17 亿美元收购助力开发者构建 AI 应用的初创公司 Weights & Biases,打造从计算到工具的垂直整合 genAI 云栈。
五、企业影响
众多企业对评估、衡量与实现 AI 投资价值缺乏信心,但 genAI 投资的可衡量回报已在各行业显现,其影响不仅限于财务层面,更重塑了工作模式、人力需求与技能标准。
(一)可衡量的 ROI 与采用指标
上半年,genAI 应用势头明显,各行业落地成功率上升,尽管不同行业与用例的采用率存在差异,但 ROI 愈发可衡量。nib Group、ResMed 等公司报告 genAI 助手实现显著成本节约,沃尔玛借助 LLM 以极低的时间与成本更新了数亿条产品信息。随着模型成本下降,ROI 测算将更乐观,内容创作、客户服务、软件开发与网络安全等领域的回报最为突出。
(二)劳动力结构变化
genAI 的普及推动了劳动力所需技能的转变。有 AI 专家指出,企业正淘汰技能陈旧的员工,转而招聘具备 genAI 技能的人才。同时,入门级岗位在各行业发生演变,86% 的高管计划用 AI 替代入门级岗位,同时催生数据管理员、AI 伦理专家、算法训练师等新职业。新职场人需掌握与 AI 生成内容交互、验证准确性并将其融入工作流的能力。
六、拓展的现实应用场景
2025 年上半年,genAI 的现实应用场景进一步扩大,在娱乐、医疗监管、消费等领域均有突破。
网飞(Netflix)5 月推出基于 OpenAI ChatGPT 的 genAI 搜索工具,用户可通过 “我想要搞笑且积极向上的内容” 等自然语言查询发现内容,提升推荐个性化程度。 美国食品药品监督管理局(FDA)5 月宣布计划于 2025 年 6 月 30 日前在所有中心部署 genAI 工具,试点项目成效显著,预计可减少重复性工作耗时,加快药物审批流程,让新药更快上市。 OpenAI 升级 ChatGPT 购物功能,提供个性化产品推荐、价格对比及直接购买链接。
七、新兴风险与挑战
genAI 在各行业展现潜力的同时,其快速发展也带来新的风险与挑战,涵盖网络安全、信息真实性、模型可靠性等多个维度。
(一)网络安全威胁升级
genAI 工具日益成为恶意攻击者实施复杂网络攻击的工具,84% 的 CEO 担忧 AI 驱动的网络攻击。2025 年 1 月,网络安全研究人员发现 DeepSeek 发生重大数据泄露,用户聊天记录、API 密钥等敏感信息曝光。此外,AI 智能体的兴起带来新安全挑战,若缺乏有效监管,可能导致数据泄露或凭证滥用。
(二)深度伪造与虚假信息蔓延
AI 生成逼真深度伪造内容与虚假信息的能力不断增强,2025 年第一季度,全球因深度伪造诈骗造成的经济损失超 2 亿美元。一项针对 16 款主流深度伪造检测工具的研究显示,无一能可靠识别现实中的深度伪造内容。
(三)幻觉问题加剧
与预期相反,部分新型推理模型的幻觉问题比前代更严重。OpenAI 的 o3 推理模型在 PersonQA 基准测试(回答公众人物相关问题)中幻觉率达 33%,是前代 o1 模型的两倍;更新的 o4-mini 幻觉率更高,达 48%。在更通用的问题测试中,o3 和 o4-mini 的幻觉率分别为 51% 和 79%,而 o1 为 44%。这一问题并非 OpenAI 独有,DeepSeek 的 R1 推理模型幻觉率也高于其传统 AI 模型。
八、未来展望与结论
genAI 正从新奇技术阶段迈向实际影响阶段,推理能力突破、深度研究与智能体工具涌现、各行业可衡量 ROI 的出现,标志其已逐渐成为数字化转型的核心支柱。但仍存在诸多待解问题:初创企业能否凭借更高效架构与低成本策略持续挑战行业巨头?幻觉率能否快速下降,使 genAI 成为企业级决策的可靠基础?
2025 年下半年,行业可能迎来进一步颠覆与机遇:基础设施将更优化;AI 智能体有望加速发展,随着主流企业推进智能体平台及初创公司快速创新,自主系统部署将更广泛;genAI 与企业系统的融合也将更深入。
在 genAI 重塑各行业竞争优势的背景下,技术成熟度不再是唯一差异化因素,企业能否协调人员、流程与数据战略以发挥 genAI 价值,将愈发成为竞争成败的关键。成功不仅取决于部署最新模型,更需要具备运营准备度、文化适应性及明确的 AI 价值驱动愿景。






☟☟☟
☝
精选报告推荐:
11份清华大学的DeepSeek教程,全都给你打包好了,直接领取:
10份北京大学的DeepSeek教程
8份浙江大学的DeepSeek专题系列教程
4份51CTO的《DeepSeek入门宝典》
5份厦门大学的DeepSeek教程
10份浙江大学的DeepSeek公开课第二季专题系列教程
6份浙江大学的DeepSeek公开课第三季专题系列教程
资料下载方式
Download method of report materials


如需获取更多报告
报告部分截图

编辑:Zero

文末福利
1.赠送800G人工智能资源。
获取方式:关注本公众号,回复“人工智能”。
2.「超级公开课NVIDIA专场」免费下载
获取方式:关注本公众号,回复“公开课”。
3.免费微信交流群:
人工智能行业研究报告分享群、
人工智能知识分享群、
智能机器人交流论坛、
人工智能厂家交流群、
AI产业链服务交流群、
STEAM创客教育交流群、
人工智能技术论坛、
人工智能未来发展论坛、
AI企业家交流俱乐部
雄安企业家交流俱乐部
细分领域交流群:
【智能家居系统论坛】【智慧城市系统论坛】【智能医疗养老论坛】【自动驾驶产业论坛】【智慧金融交流论坛】【智慧农业交流论坛】【无人飞行器产业论坛】【人工智能大数据论坛】【人工智能※区块链论坛】【人工智能&物联网论坛】【青少年教育机器人论坛】【人工智能智能制造论坛】【AI/AR/VR/MR畅享畅聊】【机械自动化交流论坛】【工业互联网交流论坛】
入群方式:关注本公众号,回复“入群”

