AI 7月报：Agent加速应用，平台竞争转向上下文权限的争夺，端侧AI应用加速布局

核心观点

AI-7月报

观点聚焦，AI平台竞争的核心已从成本和速度转向对“上下文权限”的掌控。通过接口封装和结构绑定形成生态壁垒。同时，AI原生公司展现出显著更强的规模化能力，多模型策略和智能体部署成为主流，长上下文与RAG协同将进一步催生革命性应用。

端侧AI上，AI加速向用户贴身场景渗透，AR眼镜（阿里、XREAL/谷歌）和智能穿戴设备（亚马逊收购Bee、OpenAI布局硬件）成为关键载体。竞争焦点在于生态整合（支付/导航/OS/芯片）和新型交互能力（视觉/听觉/环境感知）。

在新技术、模型发布上，最值得关注的是deepseek与北大合作斩获的ACL年度最佳论文中讨论的把稀疏注意力从理论推理带进了完整训练流程。此外，新模型逐渐向“主动规划”和“长程记忆”跃迁（如世界模型、MIRIX记忆系统、稀疏注意力加速）。各厂商加速布局智能体（Agent）及其开发平台，OpenAI、Minimax等都推出相关产品。

巨头围绕数据、API访问权和顶尖人才展开激烈博弈，如Anthropic切断OpenAI API访问、Meta成立超级智能实验室挖角。人才、API和生态控制权成为关键战略资源。

国内资本密集投向AI底层硬科技和供应链关键环节，特别是国产高端GPU/推理芯片（曦望）、芯片级散热（锐盟）、AR硬件（影目）等“卡脖子”领域。

月报快览

华强电子产业研究所

观点聚焦

平台竞争正从成本与速度，转向上下文权限的争夺
Meta发布40页报告，具身智能的下一步是“心智世界模型”
47%的AI原生公司进入规模化阶段，发展显著快于AI赋能型公司
Gemini 2.5 Pro负责人：百万上下文可解锁很多应用场景

端侧AI趋势

阿里巴巴首款自研旗舰AI眼镜推出
美泰与OpenAI联手，共探生成式AI智能玩具新领域
XREAL One Pro推出，实现行业突破性的57度视场角（FoV）
亚马逊收购可穿戴初创公司Bee
OpenAI宣布完成对io公司收购，Jony Ive正式加入OpenAI
英伟达推出开源OpenReasoning-Nemotron支持100%本地运行
Hugging Face开源3B模型：双模式系统+128K上下文
VIVO发布端侧多模态模型，3B大小可理解GUI界面

技术&模型发布

DeepSeek下一代技术提前曝光，梁文锋署名论文获ACL2025最佳论文奖
GPT5发布性能未与其他顶尖模型拉开差距，API降价推进商业化
Grok 4在HLE人类最后考试取得45%的第一成绩
谷歌DeepMind推出新一代通用世界模型Genie 3
OpenAI开源两个新推理模型，o4-mini水平
MiniMax推出Agent全栈开发功能
ChatGPT Agent推出，实测效果不及MiniMax、Manus、Genspark等
Kimi K2技术报告正式发布：万亿参数智能体秘密解析
阿里开源Qwen3-Coder-480B-A35B-Instruct编程大模型
MIRIX长期记忆：超Gemini 410%，节省99.9%内存
DeepMind获IMO官方“唯一”金牌，OpenAI抢先宣布
Cloudflare给 AI 爬虫立下了新规矩，获得许可or付费
美图AI影像Agent RoboNeo从修图到建站一键搞定
高德地图小高老师智能体上线，实时提供出行和生活服务建议

产业动态

Anthropic切断OpenAI对Claude API访问权限
Meta 成立“超级智能实验室”
AWS CEO Matt Garman详解亚马逊AI战略
Anthropic闪电夺回被Cursor挖走的核心编程大将
苹果向英伟达生态妥协，MLX框架主动适配CUDA
OpenAI 30 亿美元收购Windsurf被谷歌截胡

算力基础设施

华为CANN全面开源开放挑战CUDA生态垄断
国家网信办就H20芯片漏洞后门安全风险约谈英伟达
美解除封锁，英伟达可向中国销售H20 AI芯片
扎克伯格宣布2026年启用1GW「Prometheus」集群

AI投融资趋势

AI算力芯片企业曦望Sunrise宣布完成近10亿元人民币Pre-A轮融资
AI芯片散热公司锐盟半导体再获数千万融资
AR眼镜厂商影目科技已完成超1.5亿元B2轮融资
智谱AI再获10亿战略融资
AIGC独角兽硅基智能完成D轮融资，数字人业务营收数亿
Thinking Machines Lab种子轮融资20亿美元，投后估值120亿美元
前Meta Reality Labs顶尖科学家团队创立AI研究实验室 Memories.ai

观点聚焦

平台竞争正从成本与速度，转向上下文权限的争夺

模型正成为软件开发的第四层基础设施，与计算、网络、存储并列，从“被调用组件”转变为系统的控制中枢；AI平台竞争焦点从成本与速度转向上下文控制权，通过接口封装和结构绑定形成高壁垒的生态锁定；推理层成为新的系统主权竞争场，平台通过接口定义、上下文管理和任务调度能力重塑开发范式和商业模式。

Meta发布40页报告，具身智能的下一步是“心智世界模型”

Meta发布40页报告，首次将"心智世界模型"与物理世界模型并列为具身智能的关键组成部分；心智世界模型关注人类的目标意图、情绪状态、社会关系和交流方式，使AI能理解人类心理状态并进行社会互动，Meta提出整合"观察学习"(系统A)和"行动学习"(系统B)的双系统架构，前者提供抽象知识，后者负责探索行动，以实现更高效的智能体学习。

47%的AI原生公司进入规模化阶段，发展显著快于AI赋能型公司

硅谷顶级VC ICONIQ Capital调研300家AI公司后揭示，AI原生公司发展显著快于AI赋能型公司，47%已进入规模化阶段，而赋能型仅13%，企业正从概念炒作转向落地实战，OpenAI和Claude位居企业AI选型首位，近90%高增长初创公司正在部署智能体；

AI成本结构随产品成熟度发生转变，从初期以人才成本为主(57%)到规模化阶段算力成本占主导，高增长公司月均推理支出高达230万美元；

大多数公司采用多模型策略(平均使用2.8个供应商)，AI定价面临挑战，73%公司选择免费或捆绑方式提供AI功能，编程助手是企业内部应用ROI最高的AI场景。

Gemini 2.5 Pro负责人：百万上下文可解锁很多应用场景

Gemini 2.5 Pro长上下文技术专家认为当前百万级token模型质量尚未完美，盲目追求更大规模意义不大；长上下文与RAG是协同关系而非替代关系，前者负责精细处理，后者负责从海量信息中粗筛，两者结合能提高信息召回率。

千万级token上下文很快将成为标准，随着成本下降和质量提升，将为代码开发等应用场景带来革命性突破，使AI能同时处理超越人类极限的信息量。

端侧AI趋势

阿里巴巴首款自研旗舰AI眼镜推出

7月26日，阿里巴巴在2025世界人工智能大会上正式公布首款自研旗舰AI眼镜——夸克AI眼镜，预计年内发布。眼镜将与阿里及支付宝生态融合，可使用支付宝“看一下支付”，具备通义千问大模型、夸克最新AI能力，还支持高德导航、淘宝比价、点外卖、飞猪商旅提醒等功能。

据供应链消息，阿里智能眼镜采用高通AR1+恒玄BES2800的方案以及安卓+RTOS双系统。还使用了可换电的双电池系统，用户可通过热插拔主电池实现24小时续航。

美泰与OpenAI联手，共探生成式AI智能玩具新领域

全球知名玩具制造商美泰（Mattel）宣布与OpenAI达成战略合作，计划共同开发基于生成式AI的智能玩具。这是OpenAI首次涉足玩具制造领域，也是美泰在数字化转型和AI技术应用上的重要一步。美泰2024财年收入53.8亿美元、净利润5.42亿美元。

XREAL One Pro推出，实现行业突破性的57度视场角（FoV）

XREAL One Pro沿袭XREAL One超轻量机身与1080p级Micro-OLED显示，相比XREAL One实现行业突破性的57度视场角（FoV），XREAL One Pro沿用XREAL自主研发的全球首款专为AR眼镜定制的X1空间计算芯片。

根据IDC数据，XREAL连续三年蝉联AR领域全球销量冠军，且在2024年全年市场份额是第二、三、四名的总和。在2025年第一季度，XREAL在全球AR/VR大行业中，份额位居全球市场前二，仅次于Meta，超越字节跳动。

2025年5月，Google I/O 开发者大会上，Google宣布正与全球智能眼镜头部企业XREAL深度战略合作，联合发布新一代智能眼镜——Project Aura。

XREAL作为Goole全球AR领域首家且唯一合作的中国企业，Project Aura将是一款搭载着XREAL自研的中国芯片X1S，专为Android XR平台打造的全球首款旗舰级智能眼镜。这款产品既是中国AR芯片首次与国际巨头XR平台的深度整合，也是Android XR生态首次实现眼镜端的完整落地。据悉，Project Aura将于2026年正式推出。

亚马逊收购可穿戴初创公司Bee

亚马逊公司向外界证实，计划收购可穿戴初创公司Bee。Bee公司的首席执行官兼联合创始人Maria de Lourdes Zollo证实了这个消息。

Bee公司总部位于美国旧金山，该公司生产了一款售价 49.99 美元的腕带手环，外观与 Fitbit 智能手表类似。该设备配备了自研的AI模型和麦克风，可以监听和分析对话，提供摘要、待办事项列表和日常任务提醒。收购后，Bee的技术有望强化亚马逊Alexa的“听觉”能力，还可以用于云办公、物流配送和健康管理等场景。

OpenAI宣布完成对io公司收购，Jony Ive正式加入OpenAI

OpenAI完成对io公司收购，前苹果设计师Jony Ive及其团队LoveFrom正式加入，担任深度设计与创意职责，Ive可能将帮助OpenAI开发全新智能硬件产品，团队已经将初步想法转变为切实可行的设计，io公司由Ive与多位专家共同创立，汇集了硬件软件工程师、科学家等专家，将与OpenAI研发团队紧密合作。

英伟达推出开源OpenReasoning-Nemotron支持100%本地运行

英伟达开源了OpenReasoning-Nemotron，在多个基准测试的同规模模型中取得了S

OTA得分专为数学、科学、代码定制提供四种参数规模：1.5B、7B、14B和32B，可在本地100%运行。不过，这些模型还是“国产血统”：架构基于Qwen2.5 ，SFT训练使用的是DeepSeek-R1-0528生成的数据。OpenReasoning-Nemotron是目前最强的蒸馏的推理模型。

Hugging Face开源3B模型：双模式系统+128K上下文

Hugging Face开源3B参数模型SmolLM3，性能超越Llama-3.2-3B和Qwen2.5-3B，支持128K上下文窗口及6种语言，模型采用双模式系统，用户可通过标志在深度思考和非思考模式间灵活切换，采用三阶段混合训练策略，在11.2万亿tokens上训练，并开放架构细节、数据混合方式等全部技术细节。

VIVO发布端侧多模态模型，3B大小可理解GUI界面

vivo发布端侧多模态模型BlueLM-2.5-3B，支持GUI界面理解，在20余项评测中表现优异，模型支持长短思考模式自由切换，引入思考预算控制机制，优化推理深度与计算成本平衡。

采用精巧结构(ViT+Adapter+LLM)和四阶段预训练策略，通过高质量数据筛选和自建训练平台提升效率，缓解多模态模型文本能力遗忘问题。

技术&模型发布

DeepSeek下一代技术提前曝光，梁文锋署名论文获ACL2025最佳论文奖

全球自然语言处理领域的顶级会议 ACL 公布了今年的最佳论文。这个会议堪称自然语言处理领域的“世界杯”，不仅是未来一两年大语言模型的风向标，而且从这里走出的顶尖技术，往往会迅速被全行业采纳。当年颠覆了整个 AI 领域的 Transformer 架构，最初就是在这里崭露头角的。而今年，一篇由 DeepSeek 和北京大学联合完成的论文斩获了“最佳论文奖”：《Native Sparse Attention: Hardware-Aligned and Natively Trainable Sparse Attention》。

首次把稀疏注意力从理论推理带进了完整训练流程，在保持模型性能的同时，还带来了高达 11 倍的推理加速。核心思想是模仿人类阅读长篇报告时的智慧：粗读摘要（Token Compression）、精读重点（Token Selection）和强记最近（Sliding Window）。

GPT5发布性能未与其他顶尖模型拉开差距，API降价推进商业化

8月8日，OpenAI发布GPT-5，相比此前Altman表示的“GPT-5的能力让人瘫倒在椅子上”低于预期。在各个垂直领域，GPT-5都刷新了基准测试成绩，其中编程能力的进化最为显著以及其他细节的提升，但没有大的惊喜，在HLE人类最后测试上也未超过Grok 4。

同时，GPT-5向所有人开放，然后依据会员等级限制使用次数。API方面开启了一轮大降价。企业用户可以通过自己的预算来调低中高档位，分别为GPT-5标准版、GPT-5-mini版、GPT-5-nano版。其中GPT-5-mini 的价格低于谷歌的 Gemini 2.5 Flash，而 GPT-5 Standard 的价格仅为 Claude 4 Opus 的十二分之一。

尽管OpenAI一直在强调“GPT-5是世界上最好的编程模型”，但在OpenAI的直播展示中，却出现了Benchmark图的坐标轴“作弊”的行为，不仅有 52.8 > 69.1 这样的错误，也实际上夸大了 GPT-5 的能力提升。

GPT-5的发布可能代表着大模型能力上限似乎逐渐趋于收敛，顶尖AI公司模型之间的性能差距非但没有拉开，反而越来越小，性能表现日益趋同。而在此背景下，OpenAI开始通过进一步打磨细节，以及API分层降价来推进商业化。

Grok 4在HLE人类最后考试取得45%的第一成绩

Grok 4在覆盖范围最广、难度最高的终极闭卷学术基准HLE人类最后测试中，取得25.4%的成绩，打破之前Gemini 2.5 Pro的21.6%的记录，在使用工具模式下取得38.6%和44.4%（Grok 4 heavy，多模型协作）的成绩，远超Gemini 2.5 Pro和Claude 4 Opus，马斯克表示Grok 4以「第一性原理」构建推理机制，像物理学家那样思考，从基本公理层面分析问题。

谷歌DeepMind推出新一代通用世界模型Genie 3

Genie 3能以每秒24帧的速度实时生成720p分辨率的动态世界，支持用户通过文本提示（如“生成一个海边小镇”）创建可交互的虚拟环境，并在数分钟内保持场景的一致性和连贯性。用户可在生成的世界中自由移动、操作物体，甚至通过文本指令动态改变天气、添加角色等，实现“实时世界编辑”。

模型具备长达一分钟的视觉记忆能力，确保场景细节（如墙上的涂鸦、桌上的物品）在用户离开后仍保持原样，避免“刷新”现象，极大提升了沉浸感。世界模型为机器人、自动驾驶等智能体提供低成本、高仿真的训练环境，加速算法迭代。

OpenAI开源两个新推理模型，o4-mini水平

OpenAI时隔多年重新开源模型，发布gpt-oss-120b和gpt-oss-20b两款推理模型，采用宽松的Apache 2.0许可证，性能与o4-mini相当。两款模型分别采用117B和21B总参数，均使用交替密集和局部带状稀疏注意力模式，原生支持128k上下文长度。模型采用原生MXFP4精度训练，gpt-oss-120b可在单个H100 GPU上运行，gpt-oss-20b仅需16GB内存，适用于高端笔记本甚至手机。

MiniMax推出Agent全栈开发功能

MiniMax推出Agent全栈开发功能，支持无代码一键构建完整应用系统，包含后端托管、支付集成和定时任务等特性，用户可在30分钟内构建演唱会选座系统、实时金融数据看板、电商网站等应用，支持真实支付功能和数据处理。该功能采用模块化架构，包含调研、开发和测试三个核心子Agent，上线一个多月已发布12次更新，降低了企业级应用开发门槛。

ChatGPT Agent推出，实测效果不及MiniMax、Manus、Genspark等

OpenAI推出ChatGPT agent，面向Pro用户，但遭到Manus、Genspark等竞品公司的直接对比和批评。ChatGPT agent整合了Deep Research、Operator和ChatGPT功能，能自动完成退休计划、购物清单等任务，但输出内容较为简陋，相比之下其他Agent实测各有特色，Manus输出更美观，Minimax提供多种格式报告，Kimi内容详细且询问用户具体需求等。

Kimi K2技术报告正式发布：万亿参数智能体秘密解析

Kimi K2采用1万亿+参数稀疏MoE架构，384个专家，拥有三大核心技术突破：MuonClip优化器、Agentic数据合成管线和RLVR+自评Rubric奖励；MuonClip优化器通过QK-Clip权值裁剪确保训练稳定，实现15.5万亿tokens训练零loss抖动；数据复述策略放大高质量数据价值；三步式智能体数据流水线构建了20,000+合成工具，结合可验证奖励与自评判奖励的强化学习框架，使模型从被动对话进阶到主动规划-执行-自我纠错的Agent水平。

阿里开源Qwen3-Coder-480B-A35B-Instruct编程大模型

阿里开源Qwen3-Coder-480B-A35B-Instruct模型，参数量4800亿，支持256K上下文，最大输出6.5万token，该模型在智能体编程、浏览器使用和工具调用三类任务中，对标Kimi K2、DeepSeek V3等开源模型和GPT-4.1等闭源模型。模型预训练使用7.5万亿token数据(代码占70%)，并在20000个独立环境进行强化学习训练。

MIRIX长期记忆：超Gemini 410%，节省99.9%内存

UCSD和NYU团队推出多模态AI记忆系统MIRIX，在ScreenshotVQA基准测试中准确率比传统RAG高35%，存储减少99.9%。MIRIX设计六大类人记忆系统(核心、情景、语义、程序、资源和知识金库)，通过多智能体协作和分层检索模式构建认知基础。

团队已开源MIRIX并发布Mac应用，支持多模态输入(文本、屏幕截图、对话日志)，可将记忆本地存储于SQLite数据库保护隐私。

DeepMind获IMO官方“唯一”金牌，OpenAI抢先宣布

谷歌DeepMind新 Gemini模型在IMO竞赛获官方金牌，解决六题中五题，首次证明AI仅用自然语言可解复杂数学题；DeepMind遵循IMO规则，等待官方结果验证后才公布成绩，获业界赞誉，OpenAI因不参与官方评估且提前公布成绩而引发争议，被批评缺乏规范与合作精神。OpenAI分数由于未经官方评分标准评估真实性被质疑，或被扣分降至银牌水平。

Cloudflare给 AI 爬虫立下了新规矩，获得许可or付费

Cloudflare推出"Pay Per Crawl"实验性功能，允许网站对AI爬虫设置允许、收费或封锁，让内容创作者对自己的内容拥有议价权，数据显示AI爬虫与传统搜索引擎存在巨大差距：谷歌每6-7次抓取带回1次点击，而OpenAI需1500次、Anthropic需73300次才带回1次点击，严重打破原有生态平衡。

该功能通过HTTP 402状态码和数字签名认证机制实现收费控制，目前处于内测阶段，可能为互联网内容创作者开创从"广告变现"到"内容授权变现"的新模式。

美图AI影像Agent RoboNeo从修图到建站一键搞定

美图发布AI影像Agent产品"RoboNeo"，支持通过一句话指令完成图片精修、品牌设计、网页制作等多项功能，覆盖电商运营、品牌推广、产品营销等场景，能生成商业级精修图片、360°产品视频、动态广告、效果预览和建站。

实测显示RoboNeo能显著提升影像素材制作效率，但在连续性和对物理世界理解方面存在短板，目前更适合作为素材生成助手。

高德地图小高老师智能体上线，实时提供出行和生活服务建议

高德地图推出AI版本，核心是"小高老师智能体"，能根据用户所处时空提供实时出行和生活服务建议，可智能规划行程，推荐适合场所，提供特种兵旅行方案，并能一键导航，实现行程前中无缝衔接。

高德AI导航具备超视距感知能力，可预测多路口红绿灯、计算最佳车速和车道，提前预警危险，实现千人千面甚至一人N面的个性化出行体验。

产业动态

Anthropic切断OpenAI对Claude API访问权限

Anthropic切断OpenAI对Claude API访问权限，指控其违反服务条款，利用Claude工具开发即将发布的GPT-5，OpenAI被指利用API评估Claude编程能力并进行安全测试，根据Anthropic的商业条款，任何客户都不得利用其服务“构建与之竞争的产品或服务，包括训练竞争性AI模型”，更不用说“逆向工程或复制”其服务了。

切断权限时点正值OpenAI即将发布革命性的新模型GPT-5，其最核心优势就是超强的编程能力。OpenAI认为这是行业惯例而表示失望。AI巨头围绕数据与接口展开新一轮封锁战，API成市场准入与创新博弈的战略资源，在业内引发热议与监管关注。

Meta 成立“超级智能实验室”

Meta正式成立"超级智能实验室"(MSL)，将整合基础AI研究、大语言模型开发和AI产品团队，由新任首席AI官Alexandr Wang领导，该实验室成功从OpenAI、Anthropic、Google挖来11位顶尖AI人才，华人占比超半数，包括GPT-4o和Gemini核心成员。

OpenAI核心科学家Jason Wei和Hyung Won Chung也离职加入Meta，Wei是思维链之父，Chung是代码模型负责人，苹果基础模型团队负责人Ruoming Pang或将加入Meta的新AI团队，获得每年数千万美元薪酬。

Meta计划未来几年投入数千亿美元用于AI基础设施、模型训练和人才储备，目标一年内推出超越Llama系列的下一代领先模型。

AWS CEO Matt Garman详解亚马逊AI战略

AWS CEO Matt Garman详解亚马逊AI战略：AI业务已创收数十亿美元，推理工作负载已超过训练，未来将占AI工作负载的80-90%。

AWS正与Anthropic合作建设史上最大AI训练集群（Project Rainier），部署Tranium Two处理器，性能是前代的五倍，同时也与NVIDIA保持合作关系推出P6实例，AWS认为AI降本需多管齐下（芯片创新、软件优化、算法改进），正积极扩展数据中心，年底将推出"欧洲主权云"解决数据主权问题，满足政府及受监管工作负载需求。

亚马逊还发布Bedrock AgentCore预览版，提供7大AI agents核心服务，包括运行时、记忆、身份验证等，推出Nova定制选项和Strands Agents V1.0，使agents开发更简单，实现多agents协同工作，发布Amazon S3 Vectors云对象存储，降低90%向量存储成本，并推出Kiro AI IDE简化开发者体验。

Anthropic闪电夺回被Cursor挖走的核心编程大将

Anthropic成功在两周内挽回Claude Code的核心负责人Boris Cherny和Cat Wu，他们此前被Cursor挖走；Anthropic透露直接销售模型和Claude的毛利率达60%，但通过AWS和谷歌云销售时毛利率为负30%；

Claude Code成为Anthropic的新王牌，自6月以来周下载量增长6倍达300万次，贡献超2亿美元年化收入，而竞争对手Cursor和Windsurf均面临挑战。

苹果向英伟达生态妥协，MLX框架主动适配CUDA

苹果MLX框架主动增加CUDA支持，允许开发者利用英伟达GPU训练模型后部署回苹果设备，此举被视为苹果向英伟达生态妥协，CUDA在AI开发领域占据绝对主导地位，拥有500万开发者，虽有"陈年旧怨"(2018年苹果停止对英伟达显卡的官方支持)，但出于合规考量和扩大影响力，苹果选择借力英伟达生态。

OpenAI 30 亿美元收购Windsurf被谷歌截胡

Google宣布将AI编程公司Windsurf的CEO、联合创始人及部分研发骨干纳入DeepMind团队，获得部分技术非独家使用许可。OpenAI此前已与Windsurf达成独家收购谈判协议（价值30亿美元），但协议到期未续签，为Google的迅速介入提供了机会，Windsurf近期因Anthropic几乎切断Claude模型调用容量而转向Gemini，此次人才流动反映企业加速向开发工具和平台层渗透的趋势。

算力基础设施

华为CANN全面开源开放挑战CUDA生态垄断

在8月5日举行的昇腾计算产业发展峰会上，华为宣布昇腾硬件使能的核心基础软件CANN（Compute Architecture for Neural Networks，神经网络异构计算架构）全面开源开放，Mind系列应用使能套件及工具链同步开源。此举旨在通过开放核心技术资产，降低产业参与门槛，加速AI创新与应用落地，推动中国AI产业从“硬件追赶”向“生态引领”跨越。

英伟达的CUDA平台因其成熟生态和广泛开发者支持而领先。华为开源CANN旨在构建Ascend生态，吸引开发者从CUDA迁移或并行开发。如果CANN生态快速成长，可能分流部分开发者资源，长期削弱英伟达生态的独占性。此外，开源CANN可能加速华为AI技术迭代，通过社区贡献优化Ascend性能。这对英伟达形成间接压力，促使其加快CUDA、cuDNN等工具的创新步伐，以维持技术领先。

国家网信办就H20芯片漏洞后门安全风险约谈英伟达

7月31日，近日英伟达算力芯片被曝出存在严重安全问题。此前，美议员呼吁要求美出口的先进芯片必须配备“追踪定位”功能。美人工智能领域专家透露，英伟达算力芯片“追踪定位”“远程关闭”技术已成熟。为维护中国用户网络安全、数据安全，依据《网络安全法》《数据安全法》《个人信息保护法》有关规定，国家互联网信息办公室于2025年7月31日约谈了英伟达公司，要求英伟达公司就对华销售的H20算力芯片漏洞后门安全风险问题进行说明并提交相关证明材料。

美解除封锁，英伟达可向中国销售H20 AI芯片

美国政府承诺授予英伟达许可，将恢复对中国销售H20 AI芯片；此转变发生在黄仁勋与美国总统特朗普会面后，黄仁勋强调了英伟达对美国就业和AI领先地位的支持；英伟达2025财年第一季度收入创纪录达260.44亿美元，同比增长262%，数据中心业务收入226亿美元是主要增长动力。

扎克伯格宣布2026年启用1GW「Prometheus」集群

Meta正建设「Prometheus」AI超算集群，2026年将达1GW算力，堪比一座核电站或百万居民城市用电量；2027年「Hyperion」计划将部署超5GW级算力，占地面积与曼哈顿相当，Meta将自建天然气电厂保障供电；扎克伯格野心远超OpenAI的300-500MW星际之门计划和马斯克250MW的Colossus项目，致力打造全球最高算力。

AI投融资趋势

AI算力芯片企业曦望Sunrise宣布完成近10亿元人民币Pre-A轮融资

7月18日，国内全栈自研AI算力芯片企业曦望Sunrise宣布完成近10亿元人民币Pre-A轮融资，由三一集团旗下华胥基金、第四范式等知名投资机构共同参与，资金将用于产品研发、市场拓展和团队建设，巩固其在国产高端GPU领域的领先地位。

曦望前身为商汤大芯片部门，2024年底分拆独立，专注于高性能GPU及多模态场景推理芯片的研发与商业化，产品路线图上，曦望主打多模态推理AI芯片领域。曦望S1是基于DSA的云边视觉推理专用芯片，已量产并出货超2万片；曦望S2是大模型推理GPGPU产品，完全兼容CUDA生态，性能对标英伟达A100，已量产且有万片级量产能力；曦望S3正在研发中，聚焦多模态大模型推理，为全自研架构兼容CUDA生态，计划2026年量产，公司称其将让大模型推理成本进入“1分钱时代”。

AI芯片散热公司锐盟半导体再获数千万融资

深圳锐盟半导体有限公司（以下简称“锐盟半导体”）近日再获毅达资本、合创资本数千万元人民币pre-A+轮投资，由跃为资本担任独家财务顾问。这是“锐盟半导体”一年内斩获的第三笔融资，年度融资规模已逼近亿元。

锐盟半导体成立于2020年，正加速推动智能终端及高算力芯片级主动式散热微系统迈向规模化商用，是国内稀缺的垂直整合型微系统方案商，构建了完整的“材料-器件-芯片-算法”技术闭环。其产品MagicCool散热微泵实现毫米级厚度与工业级散热效能的平衡，基于压电MEMS技术，与现有半导体和先进封装工艺兼容，通过高频压电振动带动气体或液体流动实现高效散热。

AR眼镜厂商影目科技已完成超1.5亿元B2轮融资

影目共推出3个系列AI+AR产品覆盖3大主要场景：INMO AIR 聚焦轻办公+影音娱乐、INMO GO 聚焦翻译、INMO X聚焦拍照。其中，INMO AIR系列采用的是阵列光波导方案。

根据IDC所发布的《IDC Quarterly Augmented and Virtual Reality Headset Tracker, 2025Q1》报告显示，2024年全球AR&ER智能眼镜市场规模达2.9亿美元，同比增长24.1%；其中AR眼镜消费出货同比暴涨36%。在这其中，影目科技凭借INMO GO、INMO AIR系列产品斩获2024年度中国AR眼镜市场出货量占比47.6%、销售额占比39.7%的双料冠军。

智谱AI再获10亿战略融资

7月2日，在智谱开放平台产业生态大会上，智谱宣布浦东创投集团和张江集团对智谱总额10亿元的战略投资，并于近期完成首笔交割。同时，三方还启动了一项合作，共同建设人工智能新型基础设施。

AIGC独角兽硅基智能完成D轮融资，数字人业务营收数亿

7月5日，AIGC独角兽硅基智能近日完成数亿元D轮融资，投资方为嘉兴高新区产业基金。本轮资金将重点用于研发创新投入、推动技术落地并加快产品的市场化应用。

自2017年成立以来，硅基智能已完成超十亿元、10轮融资，其背后投资方包括腾讯、红杉中国、招银国际、中财奇虎、海松资本等。公司聚焦AIGC数字人技术研发与商业化应用，提出以硅基劳动力为核心，构建了DUIX智能交互平台、虚拟直播平台、视频生产平台和智能客服四大产品线。

Thinking Machines Lab种子轮融资20亿美元，投后估值120亿美元

7月16日，据《金融时报》报道，OpenAI 前 CTO Mira Murati 的创业公司 Thinking Machines Lab 在一轮「种子轮融资」中成功募集了 20 亿美元，投后估值达到 120 亿美元，成为硅谷历史上规模最大的种子轮融资之一，此轮融资由知名风投公司a16z领投，Nvidia 和 AMD 也位列投资者名单。

前Meta Reality Labs顶尖科学家团队创立AI研究实验室 Memories.ai

7月25日，由前 Meta Reality Labs 顶尖科学家团队创立的 AI 研究实验室 Memories.ai，正式宣布完成 800 万美元种子轮融资。本轮融资由 Susa Ventures 领投，三星风投（Samsung Next）、Fusion Fund 等知名机构跟投。

Memories.ai团队已经在大模型领域完成了一项重大的突破成果，旨在解决AI系统的记忆缺失问题，为视觉模型创造了强大的记忆大脑。

关于华强

1 / Earth Hour

♦ 华强电子产业研究所（HQ Research）成立于2012年，是深圳华强（股票代码000062.SZ）旗下专注于电子产业链研究和科技创新赋能的第三方行业智库。

华强电子产业研究所设有国际科技创新赋能中心、电子产业成果转化与技术转移服务平台、专精特新加速器平台、产业研究咨询中心四大服务主体，主要开展科技创新赋能和产业研究咨询两大核心服务，助推电子产业高质量发展。

♦ 深圳华强实业股份有限公司（简称“深圳华强”）于1994年成立，1997年1月在深圳证券交易所上市，在电子信息产业深耕三十余年，打造了中国本土最大的综合性电子元器件交易及服务平台，既是国内电子元器件授权分销龙头企业（主品牌为“华强半导体集团”），也是电子元器件长尾交易数字化、智能化变革的先行者，并拥有全球最大的电子专业市场“华强电子世界”和全球知名的电子元器件B2B信息服务网站“华强电子网”。

点击关注了解更多