在上篇中,我们介绍了FPGA的前面两个特点:硬件可编程、并行与实时,也列举了这两个特点带来的诸多机会。在本文中,我们将继续介绍另外两个特点,以集齐FPGA的四大特点和生存机会。
FPGA四大特点与生存机会(续)
FPGA从90年代就开始逐渐集成一些硬化功能模块,如SRAM块,DSP块,高速串行收发器XCVR或叫Serdes,PCIe和以太网硬核,DDR控制器,CPU,后来集成了高速ADC/DAC,再后来集成了H.264/265 Codec,HBM,AI加速引擎AIE或叫NPU。
说到集成ARM处理器的FPGA SOC,赛灵思ZYNQ系列的成功堪称史诗级,可以说在FPGA圈毫无对手。据不完全估计,赛灵思有接近一半销售额来自ZYNQ和ZYNQ Ultrascale系列。甚至7纳米的产品系列,全部都集成了ARM处理器,你不用都会觉得浪费。

「ZYNQ内部结构中的PL与PS」
Intel常年以x86盟主自居,因此旗下Altera对ARM首鼠两端,SOC做的并不成功。最近几年,集成RISC-V这种开源架构处理器,在诸多方面变得越来越有吸引力,让我们拭目以待。
我认为,这种集成仍然要有传统FPGA逻辑才有意义,否则只是单纯集成其他功能模块,有无数商家可以做,FPGA厂家优势将不复存在。当然,高集成度的成本也必须可控,如果像早期ZYNQ定价策略那样,把高集成度当奢侈品卖,一定曲高和寡,大部分客人就会转而追求低成本而牺牲一定的集成度。比如国产ARM SOC+国产FPGA组合这几年就比较火,且国产ARM SOC的性能和AI算力都很能打,性价比高。
通用SOM核心板
当FPGA SOC出现以后,有一种用法是把它做成SOM,即核心板,就像x86嵌入式应用中的COMe那样。通用核心板不分具体应用,可以根据客户的应用自由定义,在工业,医疗,仪器仪表等领域应用广泛。它具备普通ARM核心板的特性,也有FPGA部分的灵活性来自由定制其他功能。
「System on Module, SOM」
机器人,运动控制,PLC
FPGA SOC结合了ARM处理器与FPGA逻辑单元,这种架构让工业控制应用能够在硬件和软件之间实现高速高效协同工作。CPU可以运行PLC控制算法、机器人路径规划、运动控制算法等复杂的高层软件任务。FPGA部分用于实现硬实时、低延迟的控制任务,如信号采集、传感器数据处理、PWM信号生成、运动轨迹控制等。FPGA的并行处理能力使得这些控制任务能够在硬件层面高效达成。
由于FPGA SOC的高集成度,实时性,灵活可定制,在运动控制和伺服驱动领域,抢掉了很多传统工业处理器和DSP处理器的市场,在工业打印机,3D打印机,血液生化分析仪,ATM存取款机等机电一体的设备中都有合适的应用场景。
「协作机器人」
医疗内窥镜,手术机器人
内窥镜是另一个集成度要求很高的应用场景。通常内窥镜CHU(摄像探头)里面会有一个FPGA做视频接口和预处理,CCU(摄像主机)里面可以用FPGA做ISP,用硬核做H.264/265压缩并存储,部分高端系统会用FPGA做AI推理加速,增强图像效果,提供辅助诊断。
手术机器人基本上就是内窥镜加精密机械臂控制,而据说手术机器人机械臂上面的马达非常精密,与工业机器人完全不是一个量级。目前这部分依赖进口,以后或许可以国产替代。
车载激光雷达,毫米波雷达
最近几年兴起的车载激光雷达和毫米波雷达,由于体积受限,对系统集成度要求很高。举例来说,FPGA SOC在车载毫米波雷达中主要承担数字信号处理与系统控制的核心角色。PL部分负责TDC延时链生成,处理雷达信号,执行快速傅里叶变换(FFT)、距离/速度解算等任务。PS部分负责系统管理、数据融合、通信与决策。ASIL C/D级别功能安全(FuSa)需要PL和PS协同工作,相互监控。最后生成4D点云(距离、速度、方位角、高度),送往自动驾驶域控制器。
「车载激光雷达」
KVM坐席管理系统
大型指挥调度场所的坐席管理是一个有趣的市场。中低端的分布式KVM用普通的H.264/265 Codec就行,海思或Rockchip都可以,对延时和画质要求不高,这种应用基本没有FPGA啥事。而高端应用,延时敏感,画质要求高的场景,就有FPGA用武之地了。FPGA SOC主打低延时高品质,首先自己内嵌的H.264/265 Codec要够好延时够低,至少要支持4:2:2,可以做高质量视频深压缩,也可以做预览流,其次用逻辑部分做出浅压缩(比如JPEG2000, JPEG XS),实现双流。赛灵思ZUxEV推出时,也没具体针对KVM应用,但提高集成度会带来意想不到的市场。
另外,相对于分布式KVM,光纤KVM就是另一个故事了。通常光纤KVM不采用视频压缩,用FPGA多通道Serdes实现大带宽暴力传输,保证极低延时和无损画质。

「KVM坐席管理系统」
专业相机和编解码器
在PTZ专业相机和视频编码器市场,与KVM的需求有点类似。他们通常也需要深浅双流压缩,比如Full NDI浅压和H.264/265深压。NDI用PL和PS部分实现,H.264/265用Codec硬核搞定。
5G基站RRU
赛灵思的RFSOC DFE将数字前端(DFE)、ADC/DAC 和可编程逻辑整合在单一芯片中,减少外部元件依赖,极大地简化了5G NR基站RRU的设计,成功吸引了一些客户。Altera甚至ADI都在垂涎这一市场。
集成HBM的FPGA
大家都知道现在的GPU都集成了HBM(高带宽内存),有的FPGA内部也集成了HBM。FPGA可以通过大量的并行处理单元同时执行多个哈希计算任务,结合HBM时,可以更有效地利用内存带宽,进行更高效的数据访问和处理,非常适合数字货币挖矿。在超高端仪表和路由器的场景,在外挂DDR已经不可行的情况下,带HBM的FPGA也非常适用。同样在广播里面的安全播控应用中,FPGA中HBM的大带宽的存储,可以用来实时存储并过滤掉敏感内容。
「HBM与处理器合封」
ACAP有什么用
当FPGA集成了标量处理器,如ARM,又集成了矢量处理器,如AIE或NPU,传统的FPGA逻辑部分称为自适应处理器,这种异构计算平台还能叫FPGA吗?赛灵思把它叫作ACAP,即“自适应计算加速平台”,但这个称谓并不主流。
一个典型的异构计算平台,不能没有矢量处理器,用来做矩阵运算或AI推理加速。典型的应用场景是汽车自动驾驶,ACAP可以做自动驾驶域的主芯片。在医疗内窥镜中,NPU可以实时做图像增强等轻量化的AI加速应用,也可以用于增强现实(AR)与虚拟现实(VR)。内窥镜图像可以与增强现实技术结合,实现精确的虚拟影像叠加。而在智能监控和智能制造领域,ACAP也都可以找到合适的应用。
「ACAP架构」
特点四:新工艺,新接口
记得Altera的工艺专家曾自豪的说,我们和台积电是紧密的排他合作伙伴,台积电也喜欢用FPGA测试最新的工艺,然后再普及到其他品类的芯片上。那时FPGA总是紧跟最新工艺,很早就支持那些新的接口,因此会带来很多新机会。后来,赛灵思和台积电私下勾兑,完全不顾所谓的"排他"伙伴,以至于Altera在工艺上的优势不再。这跟AMD与Intel的情况非常相似,2017年以后,AMD抛弃自己剥离出来的芯片代工厂Global Foundry,倒向台积电代工其主流处理器,新工艺成了其反攻Intel的重要优势。
二十多年前,Lattice收购的Lucent ORCA是业界第一个带10G Serdes的FPGA,通信大厂趋之若鹜。尽管满屏Bug,我们还是傻傻的研究了很长时间。不过真的是太难用了,否则就会被用在新产品上。这说明一个新的接口对FPGA的选用是很关键的,会先入为主带来新的机会。现今的应用,只有Serdes当然是远远不够的,因为很少会用私有协议跑Serdes,需要足够多的接口IP来配合使用。
新工艺带来新接口,新接口支持更大带宽。让我们从这几个角度,来审视一下FPGA的机会。
视频接口与接口转换
FPGA其中一个重要应用就是各种五花八门的接口转换。这里的生存法则很简单:谁有硬件,谁有IP,谁性价比高,谁就有市场。
当年Lattice 带3G Serdes的FPGA性价比最高,在视频接口市场做得风生水起,占据了大部分1080p(Full HD)及以下的市场。而等视频到了4K时代,Serdes速度需求提升至 6G以上甚至12G,由于研发进度没跟上,逐渐丢失了部分市场。反而赛灵思由于Serdes速度更高更稳定以及对12G SDI, HDMI2.0的接口和IP支持,赢得了相当一部分市场。
再比如Lattice就有个系列叫Crosslink,定义为专门的“视频连接FPGA”,主要特点是硬化了MIPI DPHY,PCIe,USB等接口,用户可以方便的实现视频互连和转接,市场接受度也不错。最近也有FPGA厂家推出了硬化MIPI CPHY的产品,CPHY是三电平电路,实现难度比DPHY要大,率先支持CPHY也一定会抢得先机,在视频转接和测试测量市场先入为主。
新的视频接口如HDMI2.1,DP1.4/2.1,STMPTE ST2110接口和IP,谁有谁就可能率先被采用。SLVS-EC接口常用于高速CMOS图像传感器与处理器之间的数据传输,单Lane可达10Gbps,对想接入高端SONY Sensor的用户来说也必不可少,有的厂家也推出了免费IP,降低了客户的使用门槛。
随着视频分辨率的不断提升,对FPGA支持新接口的要求也在不停的提高。

测试测量仪表
由于FPGA可以并行控制多个测量通道,它非常适合用于高通量的自动化测试,特别是在半导体测试、电子设备性能验证等场合。对FPGA来说,就是需要大带宽,数据要“收得到,存的下,送得出”。不管是接收端,存储端(DDR或HBM),还是发送端,都需要大带宽。数据经过采集,存储,预处理,通常需要高带宽的PCIe接口把测试数据上传,送回x86或GPU做进一步处理,因此支持新的PCIe Gen4/5接口就有天然的优势。
在摄像头模组和屏测试应用中,支持MIPI CSI/DSI DPHY/CPHY标准是必需的,一些高端屏采用HDMI和eDP接口,需要测试这些摄像头和屏体就必须接入这几种接口。在存储器ATE测试市场,DDR5/LPDDR5的接口支持是必须的,且数量多多益善。100/400/800G以太网测试仪,也需要相应的接口IP支持。
随着带宽需求不断增长,新的接口标准也不停的更新,高端市场拼的就是硬实力了。比如,在高速ADC/DAC接口处,JESD204B单Lane带宽为12.5Gbps,而JESD204C单Lane达到32Gbps,谁的Serdes能稳定的接上,这部分就是谁的市场,显然高端市场对成本并不太敏感。
而PAM4 Serdes采用四电平传输,带宽比NRZ(两电平)高一倍,在波特率28Gbps时,单Lane带宽可达56Gbps。在高端数据中心,光通信,无线通信,800G网络测试仪中也有相当多的应用。
「NRZ和PAM4的眼图示意」
小结
我们在上篇和中篇主要介绍了FPGA的四大特点以及这些特点带来的主要市场机会。有了这些机会以后,FPGA就可以高枕无忧了吗?事实并非如此。商场如战场,阵地绝非一成不变,此消彼长时时刻刻都在发生。
下篇中,就让我们一起聊聊FPGA面临的困境,其五大硬伤以及可能的破局之策。
未完待续…
声明:本文内容全部来自业界资讯和个人理解,未涉及任何公司机密和客户信息,仅供大家交流参考。
2025年3月
#往期相关内容: