云端芯片在互联网大厂部署
华为昇腾作为国内 AI 芯片领域的领军企业,其昇腾910 系列芯片已在多家互联网大厂实现规模化部署,展现出国产 AI 芯片在大模型场景下的实用价值。昇腾 910B 是华为面向云端训练的高性能 AI 处理器,采用7nm+EUV工艺制造,拥有 32 核自研达芬奇架构,其半精度(FP16)算力达到256-320 TFLOPS,整数精度(INT8)算力达到 512-640 TOPS,功耗 310W,被视为业界算力最强的AI处理器之一。
在字节跳动,华为昇腾芯片已成为大模型训练的重要算力支撑。据最新消息,字节跳动已向华为订购了多达 10 万颗昇腾 910B 芯片。昇腾910B 的性能、能效都优于 NVIDIA A100,字节跳动计划使用昇腾 910B 芯片来训练新的AI 模型。华为与字节跳动的合作不仅限于硬件供应,还包括软件栈的深度适配和优化,确保在大规模生产环境中的稳定运行。
腾讯与字节跳动的 AI 资本开支也将显著增长,昇腾芯片在其中扮演重要角色。在业界应用广泛的 YOLOv3、Transformer 等训练任务中,多卡昇腾910B计算系统展现出优异的性能表现。华为为多卡系统专门设计了HCCS 互连技术,可实现高速互联,形成强大的计算集群,满足大规模 AI 训练和推理需求。
华为昇腾与互联网大厂的合作模式不仅限于硬件供应,还包括联合研发、场景适配、性能优化等多个层面。通过深度合作,华为不断优化产品设计和软件生态,而互联网大厂则获得了更加适合自身业务需求的 AI 算力解决方案。这种互利共赢的合作模式,推动了国产 AI 芯片在实际应用中的快速迭代和成熟。据市场数据显示,2024 年华为昇腾出货 64 万片,在国内 AI 芯片市场占据23%~28%的份额,排名第二,仅次于英伟达。
边缘与端侧落地案例
除云端部署外,华为昇腾芯片在边缘和端侧场景也有广泛应用。昇腾310系列是华为面向边缘计算场景的 AI 处理器,采用华为自研的达芬奇架构,在功耗仅为 6.5W 的条件下,提供强大的 AI 推理能力。Atlas 200 AI 加速模块集成了昇腾 310 处理器,可在边端侧实现目标识别、图像分类等AI 应用加速,广泛用于智能边缘设备、机器人、无人机、智能工控等边端侧AI 场景。
在智能安防领域,华为昇腾 Atlas 200 AI 加速模块被广泛应用于各类智能摄像头中。南方电网深圳供电局与华为携手,在边缘侧部署输电视频监控终端,集成 Atlas 200 AI 加速模块,运行 AI 推理算法进行就地图像视频分析,使巡检效率提升了 80 倍。通过在边缘设备本地完成 AI 计算,不仅减少了数据传输延迟,也保护了用户隐私,同时降低了对网络带宽的依赖。在实际部署中,搭载昇腾310 的智能摄像头能够在复杂环境下稳定运行,满足 7×24 小时不间断工作的需求。
在工业质检场景,华为昇腾边缘芯片与机器视觉技术结合,实现了产品质量的自动检测。富士康采用华为昇腾 910 芯片+动态量化方案,显著提升了检测效率。通过将 AI 推理能力下沉到生产现场,可以实时发现产品缺陷,及时调整生产工艺,提高产品质量和生产效率。昇腾边缘芯片的低功耗特性,使其能够直接集成到工业设备中,无需额外的散热和供电设施,大大简化了部署复杂度。在智慧城市领域,华为昇腾边缘计算解决方案已在全国多个城市落地。
昇腾AI 边缘智能已经广泛应用到工业质检、高速收费稽核、智慧营业厅等场景,极大地加速了行业智能升级。例如,在高速收费稽核场景,昇腾边缘设备能够实时分析车辆信息,自动识别违规行为;在智慧营业厅,昇腾边缘设备能够提供智能客服、人脸识别等服务,提升用户体验。
华为昇腾边缘与端侧产品与云端产品形成了完整的算力梯度,支持从云端到边缘再到终端的全场景 AI 计算需求。这种云边端一体化的产品布局,使得用户可以根据实际需求选择最适合的产品形态,构建灵活高效的AI 计算系统。
截至2025 年,已有超过 100 万的开发者加入昇腾生态,有25

