在数字化浪潮的推动下,人工智能(AI)技术正以前所未有的速度重塑全球科技格局。传统通用计算网络依赖的Scale out(横向扩展)模式,即通过增加服务器数量来提升整体计算能力;而进入智能计算时代后,AI模型训练与推理对算力的需求远超以往,单一节点的算力已无法满足需求,AI驱动的智能计算网络不仅需要Scale out,更引入了Scale up(纵向扩展)模式,以应对指数级增长的数据处理和计算需求。
这种双重、混合扩展模式对芯片间、板卡间、设备间乃至机架间的互联提出了前所未有的挑战,也催生了互联技术的全面升级与创新。
“智能计算网络既要Scale out,还要Scale up,这对运力——也就是高速互联的基础提出了更高要求。”9月9日,在深圳的一场光DSP新品发布会上,Credo销售副总裁杨学贤(Simon Yang)如是说,“它(运力)贯穿于整个计算系统:从芯片内部的die-to-die互联(如HBM、UCIe),到芯片之间的chip-to-chip互联(通过VSR、MR、LR等技术),再到chip-to-module(芯片到模组),设备之间、机架之间乃至数据中心之间的互联。任何一个环节的互联瓶颈,都会导致算力资源的闲置与效率的下降。”
Credo销售副总裁杨学贤(Simon Yang)
这场发布会上,Credo正式发布其面向下一代AI网络的1.6T光DSP芯片——Bluebird,并系统性地阐述了其覆盖数据中心全链路互联的五大产品线,杨学贤与Credo光产品销售与市场副总裁Chris Collins携手,为与会行业媒体带来了一场关于AI互联技术未来趋势的深度解析。
Credo五大产品线详解
在当前地缘政治背景下,国内获取高端GPU算力受限,更凸显了通过优化“运力”来构建大规模集群超节点的重要性。Credo的产品正是抓住了这一风口,以其独特的“三高三低”特性——高带宽、高性能、高可靠性以及低功耗、低延迟、低成本,赢得了市场的广泛赞誉。
例如,在单波100G时代,Credo已实现112G甚至128G的速率,远超行业主流的100G;在可靠性方面,客户反馈其方案比对标产品高出两个数量级以上。“这些特性使得Credo的产品不仅在性能上领先,更在能效和成本上具备显著优势,成为AI数据中心构建高效运力网络的理想选择。”杨学贤强调道。
为了全面解决数据中心从芯片到机柜、从机架到网络的全链路互联挑战,Credo构建了覆盖五大关键领域的完整产品线。
AEC(有源电缆)产品线
杨学贤首先介绍了Credo的AEC产品线,这是Credo独创并拥有多项专利的明星产品。HiWire AEC电缆以其独特的紫色外观和卓越的性能,在数据中心领域独树一帜,不仅解决了100G、200G、400G及800G速率下的互联难题,更通过集成Retimer、Gearbox、PCS(物理编码子层)及FEC(前向纠错)功能,实现了对高功耗、高成本的AOC(有源光缆)和短距离、粗线径的DAC(无源铜缆)的有效替代。
尤其在AI集群中,“我们的AEC电缆支持长达7米的跨机柜连接,保持了优异的信号完整性,是构建大规模GPU集群的理想选择,能够解决速率不匹配、冗余备份等复杂场景下的互联难题。”杨学贤进一步解释道。此外,AEC还即插即用,简化了部署流程,降低了维护成本,赢得了众多互联网巨头的青睐。
Optical(光DSP)产品线
光DSP是光模块的核心,负责处理高速PAM4信号。Credo的光产品线是其技术实力的集中体现,涵盖了从50G到1.6T的全面解决方案。其中,单通道50G的Seagull系列作为第四代DSP架构的代表作,集成了VCSEL驱动器,以低成本和低功耗优势广泛应用于400G SR8和AOC光模块。“Seagull系列不仅实现了成本和功耗的极致平衡,还通过灵活的配置满足了不同应用场景的需求。”Chris Collins在介绍时如此评价。
而单通道100G的Dove系列则提供了从400G到800G的完整DSP和Gearbox解决方案,支持多种速率和模式。Dove 480支持Gearbox应用,实现了电口和光口速率的灵活转换,为数据中心的网络升级提供了便利。最新推出的Lark系列(单通道100G),作为第五代DSP架构,通过优化设计实现了功耗和延迟的大幅下降,为AI应用提供了更为高效的互联方案。
PCIe (Retimer)产品线
随着PCIe Gen 6的速率翻倍,信号传输能力大幅下降,对Retimer的需求呈指数级增长,Credo推出的基于7nm工艺的PCIe Retimer 产品为数据中心的高性能计算提供了有力支持。“我们的PCIe Retimer基于自研的SerDes技术,提供了从Gen 5到Gen 6的全面升级。”杨学贤介绍道。特别是Gen 6 Retimer,通过CPU或Switch连接到更多GPU、高速存储等设备,有效解决了高速信号传输中的衰减问题。
“Credo还独创了PILOT工具,帮助客户直观展示和分析链路状态,提升了调试和预测能力。”他补充道。这一创新工具不仅简化了客户的使用流程,还提高了系统的稳定性和可靠性,赢得了客户的一致好评。
Line Cards(线卡)产品线
Credo的线卡产品线采用了自主设计的高性能、低功耗SerDes IP,支持从25G NRZ到112G PAM4通道的最优能效与最高性能扩展。不仅支持背板与前面板连接,还全面覆盖了100G、200G、400G、800G及1.6T应用场景。
这些线卡为超大规模数据中心、运营商网络及企业数据中心提供了可靠的数据互联保障,其卓越的性能和稳定的品质赢得了市场的广泛认可。
IP & Chiplets产品线
Credo在SerDes IP和Chiplets领域同样处于行业前沿,其设计的SerDes IP在性能、功耗与制造工艺及技术风险之间实现了优秀的平衡,不仅能够在成熟工艺节点上提供兼具成本效益与低功耗优势的解决方案,还通过Chiplet形式呈现,支持与SoCs封装集成,满足了不同工艺节点上的需求。
“这一创新模式不仅提高了产品的灵活性和可扩展性,还为客户提供了更多的选择空间。”杨学贤进一步解释道。Credo的IP & Chiplets产品线已成为其技术创新的基石,为公司的持续发展提供了强大动力。
AI 军备竞赛催生光互联红利
随着AI技术的快速发展,全球范围内对AI数据中心的投入持续加大。Chris Collins进一步阐述了光互联在AI产业中的核心地位,他指出:“据我们调研,至少有11家公司的年投入超过50亿美元,部分公司甚至超过1000亿美元。据不完全统计,各大公司针对AI数据中心的总投入规模已突破 5000 亿美元,而从英伟达财报来看,其数据中心业务中 16% 的收入来自网络而非 GPU,很大一部分投资与光互连相关。”
AI智算网络与通用计算网络的最大区别在于其“双网”架构,不仅需要处理前端网络的数据传输,更需要在后端网络中将所有GPU连接在一起,形成庞大的计算集群。这种需求使得光收发器的数量至少是通用计算网络的两倍多,甚至接近十倍。
“Credo的光DSP产品线正是为应对这一挑战而生,开发能同时满足前后端网络需求的多样化DSP产品,成为Credo赢得客户的关键。”Chris Collins强调道。在能效方面,Credo的设计理念是“定制化”,当大多数厂商使用晶圆代工厂(如台积电)提供的标准单元库时,虽能快速量产,但功耗难以优化。Credo则由设计师开发定制化单元与专有时序,对电路进行深度优化。
例如112G PAM4测试芯片,在5nm工艺节点下,Credo通过优化设计将功耗降低了30%以上(相比竞品)。“这种低功耗设计不仅降低了数据中心的运营成本,还提高了系统的稳定性和可靠性。”他进一步解释道,这种对底层电路的极致优化,使其在单波224G产品上同样保持了功耗优势。
此外,Credo还提供了LRO(线性接收光模块)解决方案,进一步降低了功耗。“虽然LRO在接收链路上牺牲了一些信息获取能力,但其低功耗特性在800G及以上速率的光模块中具有显著优势。”Collins指出,低功耗的价值远不止省电,以一个 10 万 GPU 的数据中心为例进行测算:该数据中心总功耗约 150 兆瓦,需 60 万个 800G 光模块(每个 GPU 配 6 个),若光模块功耗为 15W,总功耗达 9 兆瓦(占比 6%);若采用 Credo LRO方案,功耗降低 35%,则可节省 3 兆瓦 —— 这部分电能可额外支撑 2000 个 GPU 运行,直接提升数据中心的算力规模。
针对媒体提出的 “LRO 技术应用不及预期” 的疑问,Chris 回应称,LRO 与全 DSP、LPO(线性驱动光模块)并非 “替代关系”,而是 “并行演进” 的路线。随着技术成熟,客户对 LRO 的接受度已超预期,“低功耗需求将成为主导因素”。
Credo光DSP系列产品详解
Credo的光DSP产品线呈现出清晰的代际演进和技术迭代。
50G/Lane Seagull系列
Seagull系列作为Credo第四代DSP架构的代表,集成了VCSEL驱动器,支持从1x50G到8x50G的多种配置。该系列不仅应用于400G SR8和AOC光模块,还通过优化设计实现了成本和功耗的极致平衡,其灵活性和高效性使得Seagull系列在数据中心领域得到了广泛应用。
100G/Lane Dove与Lark系列
作为第一代单波100G产品,Dove系列提供了从400G到800G的完整DSP和Gearbox解决方案。“Dove 480支持Gearbox应用,实现了8x50G电口转4x100G光口的灵活转换,解决了国内网络升级中交换机与网卡速率不匹配的痛点。”Collins介绍道。而Dove 410和Dove 800则分别提供了400G和800G的完整DSP解决方案,满足了不同应用场景的需求。
今年3月在OFC上推出的Lark系列作为第五代DSP架构,通过优化设计相比Dove系列实现了功耗和延迟的大幅下降。Lark系列不仅继承了Dove系列的优点,还在功耗和延迟方面进行了全面优化,已获得客户广泛验证。Credo展示了其客户使用Lark 850开发的800G LRO模块,功耗低至9.3W,性能与完整DSP方案一致。
200G/Lane Bluebird系列(新品)
新发布的1.6T DSP Bluebird系列采用了Credo第六代DSP架构,基于台积电(TSMC)3nm工艺技术。“Bluebird系列不仅实现了业界领先的能效比,还通过优化设计将往返单向时延控制在40ns以内。”Chris Collins在发布会上宣布。
该系列不仅支持4通道或8通道224Gbps PAM4配置,还同时推出了全功能DSP和LRO两种版本,全面覆盖了Scale-up与Scale-out等多元网络架构需求。“Bluebird系列的最大优势在于其低功耗设计。”他进一步解释道,“1.6T全DSP光模块整体功耗远低于25W,而LRO版本则可低于20W,甚至接近800G模块的功耗水平,为数据中心的高效运营提供了有力支持。”
此外,Bluebird系列还配备了整套遥测功能,支持链路实时监测与诊断,最大化系统在线时长与可靠性。这一创新设计不仅提高了系统的稳定性,还为客户提供了更为便捷的维护方式。
1.6T DSP Bluebird的技术细节与市场前景
在媒体问答环节,Chris Collins副总裁进一步阐述了Bluebird系列的技术细节和市场前景。“Bluebird系列之所以能够实现如此低的功耗,主要得益于我们在芯片设计上的创新。”他解释道,“我们采用了定制化的设计单元和专有的时序优化技术,从底层技术上实现了功耗的最佳化。”
此外,Bluebird系列在架构设计上也进行了全面优化。Credo对电口和光口进行了分别设计,不仅提高了电路的效率,还降低了不必要的功耗。
低延迟同样至关重要。Bluebird将单向延迟控制在40ns以内,这对于大语言模型(LLM)的训练和推理效率提升意义重大。客户测试表明,Credo方案的延迟仅为竞品的一半。
针对“为何直接采用3nm而非5nm”的提问,Collins解释,Credo的目标不仅是达到竞品水平,而是要“比他们更好”。通过采用更先进工艺,Credo仍能保持“N-1”的竞争优势,迫使竞争对手不得不使用成本更高的2nm工艺来追赶。
对于市场前景,他表示:“随着AI技术的不断发展,数据中心对高速、低功耗光模块的需求将持续增长。Bluebird系列凭借其卓越的性能和低功耗优势,有望在市场中占据一席之地。”
布局新兴技术,深耕中国市场
面对CPO、Chiplet、1.6T、PCIe 6等新兴技术的快速发展,Credo展现出了前瞻性的布局和深厚的积累。
Collins表示:“我们一直在观察行业变化,并在CPO领域与多家企业展开交流。由于CPO与Chiplet在架构上具有相似性,Credo凭借其Chiplet业务的积累,有望在CPO市场中占据一席之地。”
对于CPO是否会替代AEC,Collins认为短期内不会发生。AEC正从单机柜向多机柜扩展,其低功耗、高可靠性和低成本优势在AI网络中愈发明显。尽管CPO是未来方向,但不会很快批量应用。
不过,Credo 已启动相关技术储备,在Chiplet领域早有布局,其SerDes IP和Chiplet产品可与客户的ASIC集成,这使其在CPO时代同样具备竞争力。杨学贤强调,Credo了解SerDes的内部细节,因此在适配国产CPU和GPU时更具灵活性。
同时,Credo对于PCIe 6市场也充满了信心。“随着英特尔和AMD等CPU/GPU供应商的节奏加快,PCIe 6市场有望在明年迎来快速增长。”杨学贤表示,“Credo的PCIe Retimer产品线已经做好了充分准备,期待在这一市场中再造辉煌。”
对于中国市场,Credo同样给予了高度重视,不仅提供了符合国内市场需求的产品和解决方案,还积极与国内客户合作,共同推动技术创新和产业升级。据悉其Seagull系列、Dove 480等产品均是针对中国市场定制开发的。杨学贤表示,Credo将持续关注国内客户需求,提供符合本地供应链要求的产品。
尽管800G、400G 仍有 5 年以上生命周期,1.6T技术尚未大规模商用,但Credo提前发布Bluebird,正是为了与客户共同完成系统验证和性能优化,确保在1.6T真正爆发时能够迅速占领市场。
正如Credo这个名字的含义——“Our name is our guiding principle – we ‘believe’.” 在AI重塑世界的今天,Credo正以其对高速互联技术的坚定信念和持续创新,为下一代AI应用构建起坚实可靠的“运力”基石。
THE END
关注“电子工程专辑”加小编微信
现已开放地区群,请发送消息【深圳】【上海】【北京】【成都】【西安】到公众号
