随着AI浪潮的不断发展,人们越来越强烈地意识到:除了算力之外,运力对于发展AI也同样重要。
AI智算,说白了,就是算力结合算法,对数据进行处理。而如何将数据输送给算力,或者将算力输送给数据,就是运力所要面对的问题。
AI智算需要海量算力,数据规模也空前庞大。传统的通信技术根本无法提供所对应的运力。所以,新一轮运力技术革命,已经全面启动。
在这轮技术革命中,最大的主角,就是光通信。
目前,业界已经达成共识:光通信一定是支撑AI浪潮的基石,但传统光网络在面对AI智算带来的海量数据传输需求时,仍然存在不足。因此,需要在性能、灵活性、可靠性、安全性等方面进行全面升级演进。推动“全光运力”持续创新、打通“毫秒用算”通道,是现阶段光通信发展的重要目标。
业界有不少企业在探索如何构建AI时代的光互联网络,也提出了一些技术路线。在今年的517电信日、中国国际信息通信展等多场产业活动中,来自运营商、设备商及业内企业的专家们纷纷介绍了各自对光网络与AI技术深度融合的理解。
其中,华为光传送领域总裁谷云波提到的AI-OTN架构,成功吸引了大家的关注。

这个架构充分考虑了AI时代的场景需求,旨在为快速发展的AI应用构建确定性、毫秒级的高品质全光底座,非常有参考性。
接下来,小枣君就给大家做个深入解读。
█ OTN for AI,全光升级助力AI浪潮
AI-OTN,顾名思义,就是在传统OTN的基础上,针对AI时代的新场景、新需求,进行全面升级演进,从而发展出的新型OTN网络。它包括了两大战略方向,即:“OTN for AI”以及“AI for OTN”。
我们先看看“OTN for AI”。在这个方向上,主要考虑的是光传送网需要具备哪些能力,才能满足AI时代对运力的要求。
AI-OTN提出的目标,是通过构建超宽弹性、安全可靠的运力底座,实现“一点接入、算力随取”的极致体验。具体来说,包括了算间和入算两个场景:
在算间场景(智算中心之间的互联互通),AI-OTN可以通过Beyond 1T、OTN集群、DC-OTN等创新技术,实现算力资源的超宽无损互联,有效打破算力孤岛。
在入算场景(用户与智算中心之间的互联互通),AI-OTN可以通过端到端全光交换、AI增强型WSON、fgOTN细颗粒调度及量子加密等先进技术,为用户提供极致低时延、高可靠、高安全的“毫秒用算”体验。

我们分别来看这几个关键技术点的具体含义。
● Beyond 1T(超高速率)
想要支撑AI智算的需求,带宽是基本前提。
目前,国内三家运营商建成全球规模最大的全光骨干网和政企OTN精品专网,国家枢纽间正在加快规模部署400G光传输系统。800G和1.6T相关技术,也在积极验证之中。对于AI的长远发展来看,带宽肯定还是要继续往1T以上升级演进。AI-OTN提出的Beyond 1T,就是指在带宽上必须超越(beyond)1T。
这离不开光器件的迭代升级、新频段(“C+L”等)的探索以及新型光纤的普及。
带宽的升级,还必须考虑对反向复用的支持。这一点,AI-OTN将通过多个子波长来实现。通过光层子波长FlexOP技术,AI-OTN可以做到G比特到T比特任意高速业务的平滑传输。
例如,在1.6T带宽下,基于子载波技术,可以切分为16个100G,或者8个200G,能够更好地提供不同子波长的业务调度和互通,提升灵活性。

● OTN集群(敏捷调度)
目前,上海、北京、武汉、西安等重点城市的节点业务容量已经非常大,甚至达到了百T级别。东西向、南北向的算力,都在这些节点汇聚,带来了巨大的业务压力。
AI-OTN能够实现一个站点多个OTN集群的跨环敏捷调度,支持单站400Tbps的集群OTN应用。
很多核心机房的单位功耗达到8000瓦甚至10000瓦。如果没有集群能力,各个OTN框之间无法实现保护,相当于把一个核心站点变成多个站点,增加了业务发放的复杂性。
● DC-OTN(无损传输)
在可靠性方面,AI-OTN需要为DCI(数据中心互联)场景提供严格的无损传输保障。
在AIGC大模型分布式训练过程中,成百上千的GPU需要跨数据中心同步参数和梯度。传统传输网络一旦出现光纤中断或劣化,会导致数据包丢失,进而触发TCP(传输控制协议)重传或RDMA(远程直接内存访问)降速,造成算力集群效率急剧下降甚至训练中断。
为屏蔽传输层异常对业务的影响,AI-OTN通过双发选收等无损倒换机制,在保护切换过程中保持数据流不间断,实现业务零丢包与无感切换,确保业务连续性。
刚才介绍的几个技术,都是面向算间场景(骨干网)。接下来,我们再看看入算场景(城域网)。想要实现真的“毫秒用算”,这个场景最为关键。
● 极致时延
为了支持用户毫秒级算力接入,国内全光网建设正从省级核心节点向城域汇聚与边缘层快速延伸。
当前,省级、城域核心层已基本完成全光交换升级,而汇聚与边缘层正成为下一阶段部署重点。只有实现从核心到边缘的端到端全光交换,才能为千行百业提供确定性的“毫秒用算”体验。
面对城域汇聚及边缘站点空间紧张、部署复杂的难题,华为联合产业合作伙伴,在器件、模块集成度等端到端环节持续创新,最终实现设备在尺寸与性能上的双重突破,推出小型化OXC设备。其体积仅为传统设备的四分之一,可在普通汇聚机房及重要接入点实现全光调度与灵活组网。

● 极致高效
前面讨论的子载波技术,体现了灵活性的理念。在城域网场景中,面对用户业务需求多样化、动态化的特点,网络带宽也需要具备相应的灵活弹性。
传统OTN技术受限于较大的最小承载颗粒度(通常为1G),难以高效承载小颗粒业务,导致带宽资源利用率偏低。而华为fgOTN/OSU技术将最小承载颗粒精细至10M级别,实现了真正的带宽弹性化。
这一突破使得网络能够按需分配精准的带宽资源,显著提升传输通道的利用效率,让每单位带宽都发挥最大价值,为运营商构建高效、集约的城域网络奠定了坚实基础。
● 极致可靠
在智能时代,所有依赖算力的业务都对网络可靠性提出了极高要求。面对自然灾害等潜在风险和多样化的业务需求,在城域场景下我们需要构建成本可承受的高效保护机制。
传统网络在应对光纤中断等故障时,ASON的收敛时间往往超过10秒,难以满足实时业务的需求。如今,通过AI能力与智能算法的引入,结合oDSP、光放、WSS等关键技术的协同创新,AI增强型ASON将故障恢复时间从秒级压缩至50毫秒以内——这意味着网络自愈能力实现了千倍提升。
这一突破不仅大幅提升了城域网络的可靠性,更在可控成本范围内为企业用户和家庭用户提供了接近"无损"的业务体验,大幅提升算力服务质量。
● 极致安全
在智能时代,无论是AI训练、推理还是各类智能应用的部署,数据传输的安全性已成为不可或缺的核心要求,业务场景对安全等级的需求不断提升。
传统加密方式在面对日益复杂的网络攻击时,已经力不从心。华为AI-OTN创新引入QKD量子加密解决方案,通过量子密钥分发技术实现密钥的不可破解与动态更新,从根本上提升系统的安全防护水平,为智算数据流动构建起一道坚实可靠的防线,助力用户在AI时代实现数据传输的极致安全。
█ AI for OTN,AI赋能OTN全方位能力跃升
新型OTN可以为AI业务和场景保驾护航,而反过来,AI也能够大幅提升新型OTN的能力。

我们可以从设备和网络的角度分别来看:
● AI赋能OTN设备
AI-OTN将AI技术深度融入OTN设备全栈,从光器件、光模块到整机系统,全面提升设备智能水平。
在光器件层面,引入AI算法增强,可以实现光电联合损伤补偿,也可以感知信道动态,提升能效。例如,针对oDSP算法,可以通过AI能力进行算法模型优化。
在光模块层面,借助AI算法,可以对光模块亚健康状态进行预警,提前发现并排除风险。在业务开通阶段,也可以主动隔离亚健康模块,降低故障发生概率,减少对模型训推的影响。
在单板层面,可以实现对光缆的感知,达到路由还原、外破预警的效果。
在设备层面,基于AI可以实现业务应用的秒级识别,提供差异化品质保障。设备内部的内生智能,可以做到小于1dB的性能评估精度。
● AI赋能OTN规建维优
刚才介绍的是设备层面,AI在网络层面能够做什么呢?事实上,在OTN网络的规划、建设、维护以及优化阶段,AI都已经显现出巨大的潜力。
例如,在规划阶段,传统的规划方式是离线规划,光纤参数复杂加上设备器件的老化,会带来很多问题。引入AI,可以将光纤物理参数和器件物理参数做成AI模型,快速完成网络的整体在线规划和资源部署,还可以进行配置仿真,大幅提升规划的效率和准确性。
再例如,在运维阶段,AI-OTN依托网元内置算力、数字孪生等技术,将OTN升级为“智能管道”。通过对业务特征、光器件性能参数、光纤状态的感知,构建了业务、网络、光缆三层的数字化感知模型,具备“通感算一体”的能力。

基于AI,还可以建立光网络品质分析模型,对网络中出现的各种问题进行智能优化,显著提升优化的效率。此外,AI还能对故障进行快速定位和诊断,提供修复建议,缩短故障恢复时间。
当OTN遇上AI,光通信网络仿佛突然多了很多数字员工。网络的规建维优都变得更加简单高效。这不仅降低了运营商的成本,也能释放出更多的精力,专注于新业务场景的开拓以及客户体验的提升。
█ 最后的话
近日,工业和信息化部办公厅已发布《关于开展城域“毫秒用算”专项行动的通知》。
其中明确提出:聚焦算力网络发展,构建高速大容量、确定低时延、泛在广覆盖的城域网络,在城域内提供毫秒级算力资源网络通达能力,即面向基础设施实现算力中心毫秒互连(<1毫秒),面向重点场所实现算力资源毫秒接入(<1毫秒),面向应用终端实现算力应用毫秒可达(网络时延<10毫秒)。以专项行动为牵引,带动产业各方聚焦畅通毫秒用算通道,在全国范围内梯次推进毫秒用算网络建设,到2027年基本形成全域覆盖、高效畅通的城域毫秒用算网络能力体系。
我们也可以看到,国内运营商正在不断增加在全光运力基础设施上的投入,并积极探索金融、在工业、交通、能源、教育等重要行业的“毫秒用算”应用实践。
例如,上海移动打造了“1ms浦江算力光网”,以超低时延连接城市核心算力节点,支撑金融高频交易、跨国企业云端协同等高价值商业场景。再例如,湖北移动建成覆盖全省的毫秒级用算网络,服务三维测绘企业的云渲染等高实时性应用。还有北京电信,他们通过全光城市算网实现了算力与网络资源的最优配置,依托其低时延协同能力服务于卫健诊疗、交通管理等十多个行业的模型训练与实时推理。
我相信,以AI-OTN为代表的全光运力创新与升级,目前只是刚刚起步,未来还将持续提速。
全光运力与AI的深度融合,还将催生新的业务模式和服务形态,为运营商和行业用户创造更大的价值空间。在这场全光运力与AI的双向赋能中,我们有望见证一个更加智能、高效、安全的光通信新时代。