最近几年,国产厂商特别关注实时控制MCU这块市场。互联网新资讯平台了解到相比竞争趋于白热化的通用型国产MCU ,实时控制MCU/DSP如今已成为国产厂商重点突破的方向,市场供给持续活跃。
所以,实时控制MCU到底有啥不同,目前厂商开启了怎样的竞争?
实时控制MCU有啥不同?
首先,要明确的是实时控制MCU对于算法处理的需求,已经超出了传统MCU功能范畴,所以它本身是单独的一类MCU。由于系统对时间要求很严格,因此在实时控制时,系统需具有原始数据处理能力,并能在要求的精确时间内控制信号。
什么样的MCU才能被称作实时控制MCU?简单而言,对特定类型的计算,算得“非常快的”。当然,此处的“快速”是相对而言的,用于表示可能达到的最佳性能。
那实时控制MCU和通用MCU有什么不同?目前通用MCU,更多的是产品矩阵规模化,也就是通过存储、引脚、主频以及内核等参数差异化,形成更多的SKU,覆盖不同的场景。而实时控制 MCU 的核心竞争力在于实时性,也就是对 “信号链环路” 的深度实时优化,并不是单纯依靠提升主频就可以。
本质上,实时控制MCU的核心竞争力在于对实时应用场景的深度理解。具体而言,信号链环路的实时性涵盖了信号采集、中断响应、运算处理、外设控制等多个方面,任何一个环节的延迟短板都会导致整体性能下降。而通用MCU设计更侧重标准化外设堆叠,很少针对这类专用场景进行链路级优化。这也是实时控制MCU需要专注技术积累的核心原因——有深度理解应用场景的链路特性,才能实现从硬件到算法的全链条性能优化,而这正是通用产品难以替代的壁垒所在。
其中,尤其是电机对于实时控制要求最为明显,比如高速数控机床可以达到<5μm的精度,同时每分钟旋转超过20000次,想要实现这样的效果意味着信号测量和系统调整之间的时间延迟通常在<1μs内实现。由于高度时间敏感计算负担,过去设计人员使用FPGA/CPLD快速外部模数转换器+多个MCU的组合,而现在只要使用实时控制MCU就可以了。
实时控制MCU的特点
TI在白皮书中曾经介绍过实时控制处理器的一些特性:

怎么评估一款实时控制MCU好不好?主要包括几个点。
第一是信号链,它是CPU性能评估的重要组成部分。在实时控制场景中,闭环系统通过控制环路完成“数据采集-数据处理-定时更新”的完整流程。系统性能可通过信号链性能量化,信号链性能越高,闭环系统的运行速度越快。实时控制系统的构成包含三个核心环节:
-
采样与反馈采集:需在精准时刻,以高精度测量电压、电流、电机转速、电机位置、温度等关键参数;
-
处理与控制:使用采样信息将控制算法应用于输入数据并计算下一个输出命令;
-
驱动:将计算得出的输出指令作用于系统以实现控制。例如,通过调整电力电子驱动系统中脉宽调制器(PWM)的占空比来完成驱动。
实时控制的系统性能由多因素共同决定,不仅依赖CPU处理能力,还与外设访问速度、中断响应速度直接相关,这些要素共同定义了实时信号链的概念。提升信号链性能可带来明确收益:在电机控制应用中,能提高直流总线利用率并拓宽电机运行速度范围;在数字电源应用中,可提升控制环路频率,进而实现元件小型化与成本降低。
实时信号链组成:

第二是存储器,包括非易失性存储器NVM(比如闪存)、随机存取存储器RAM、只读存储器ROM、CACHE、紧耦合存储器TCM。其中,直接存储器存取 (DMA) 至关重要,它是使子系统或外设能够在无CPU干预的情况下访问RAM的功能,这一功能可以提高数据吞吐量并有助于更高效地使用中断。

第三是中断延迟,中断是处理器对需要处理的事件作出的响应,对实时控制MCU来说,延迟越低肯定越好。

第四是协处理器和加速器。为了让计算更快,肯定不能什么任务都让CPU去跑,毕竟加速器属于术业有专攻,都是为了跑特定算法而定制的。比较常见的加速器包括:
-
三角数学单元:加速几种特定的三角函数运算,如正弦、余弦、反正切、除法和平方根;
-
加密单元:加速加密算法,如数据加密标准 (DES) 对称加密算法和高级加密系统 (AES) 对称加密算法;
-
浮点单元:提供浮点数学支持,可缓解调节和饱和问题;
-
复杂数学单元:加速加法、减法和乘法等数学运算。
NPU和64位:实时控制MCU的升级路线
实时控制MCU是一个高稳定增长的市场,同时也是一个应用场景非常聚焦的市场。在这个领域中,TI的C2000一直是佼佼者。
C2000为什么实时控制能力这么强大?首先,系统需要对真实物理世界进行精密的传感,即控制论的输入,通过ADC与采样电路,将模拟信号采集并转化为数字信号。其次是处理单元,将各种电流、电压、位置等信息进行计算。之后是输出执行单元,通过PWM输出至执行结构,另外还需要通信系统以对各个模块进行沟通,包括EtherCAT、以太网、CAN、串行通信等等。
马达驱动与数字电源变换是最为常见的实时控制系统,这两种应用均要求处理器具备极高的实时性。C2000低延迟的互连技术,支持在单周期内完成ADC读取和PWM更新,这有助于提高实时信号链的性能。更好的信号链性能意味着在电机控制应用中,可以提高直流总线的利用率和电机的运行速度范围;而在数字电源应用中,则可以实现更高的控制环路频率,减少所需组件数量,从而降低成本。
除此之外,对C2000来说,(CLB, Configurable Logic Block)也是一大创新点。有些应用会用FPGA实现时序关键或特殊功能,比如电机的编码器,而TI 的CLB既能实现绝对编码器、T-format等不同编码器,也能实现有源EMI滤波器,减少数字电源应用中的EMI。
过去,传统方案可能会使用MCU+CPLD的组合,而通过在C2000 MCU/DSP中集成CLB,便可以通过单芯片替代CPLD的监测和保护功能。现在,大多数国产厂商也在加入CLB,来加速实时控制效果。

那么,佼佼者C2000未来会如何升级?通过路线图我们可以看到,几乎每两年,C2000就会有一次重要革新,近年来的革新速度明显加快。而在近期,F28P55X及F29H85X无疑是最大的升级,这两款产品一款搭载了NPU,另一款则是64位产品。

F28P55X是业界首款带有NPU的实时控制MCU。NPU可应用在太阳能及供电系统中的电弧检测以及电机驱动的预测性维护上,目前这两大应用都是C2000的主要战场。F28P55X的故障检测的准确率可高达99%,且相对于CPU,在处理CNN模型时效率提升5~10倍。
在传统的非NPU方案中,通过对直流母线电压与电流进行采样,并设置一系列触发阈值或规则来判断电弧是否发生。这种方法存在诸多限制,检测准确率往往难以提升,一般仅能达到85%左右。检测不准确可能导致两种后果:一是漏报,即实际发生电弧但未被检测到,从而增加火灾或停机的风险;二是误报,即未发生电弧却发出警报,可能导致不必要的停机。另外,传统的电弧检测还需要一颗额外的CPU提供算力。而通过最新内置NPU的F28P55X,可在单芯片中完成DC/DC转换器、逆变器以及MPPT系统,并且提供电弧检测。

F29H85X则是极具颠覆性的64位C2000产品,其内核也升级到了C29。其处理位宽从32位跃升至64位,并配备了超长指令级架构,使得单个指令周期最多能并行完成8条指令。并行运算是DSP架构的一大优势,这也是DSP与通用CPU之间的显著差异之一。C29支持多种指令大小(16、32和48位)和可变指令包大小,指令包的大小可以是16位到128 位,从而实现更好的代码密度,以及在单个CPU周期内执行最多8条16位指令。
C29到底有多强?与C28相比,C29在信号链性能上可实现2至3倍的提升。对于马达驱动的数学运算与实时运算而言,其性能可提升2倍;而在电源变换方面,C29的性能则可提升约3倍。若仅就FFT运算而言,C29的运算速度相较于C28可快出5倍,与cortex m7内核比较,则快了6倍;C29 支持常规中断(称为 INT)和称为实时中断 (RTINT) 的优化中断,RTINT 使用专用的硬件中断堆栈,相比于C28提升了4倍。

当然,并不是说有了C29,C28就不发展了,TI在未来还会继续不断更新产品。总之,TI作为风向标,可以说给实时控制MCU指明了道路:一路条是加入NPU,加入AI;另外一条路则是颠覆计算,走64位的路。
国产厂商不断加大布局
首先是纳芯微,它选择了Arm路线,并选择高性能的M7内核。2024 年底,纳芯微NSSine 系列实时控制MCU(DSP)工规版正式发布。彼时,纳芯微表示,DSP算法效率以及实时性确实比Arm强很多,而如今Cortex-M内核已在电机、电源等领域得到了应用,验证了Arm的性能绝对能够胜任实时控制MCU的任务。

如今一年过去,纳芯微在这两个月“高强度”更新产品。首先,在今年9月,共同发布超高性价比实时控制MCU(DSP)——NS800RT113x系列 ,5元起售,实现算力平权。虽然该产品为入门级实时控制MCU,定位性价比,但核心架构与此前的中端、高端产品保持一致。
NS800RT1135/1137 搭载主频200MHz的M7内核,支持ECC的128~256KB Flash与 80KB TCM(CPU核内0等待内存),均支持ECC功能,显著提升实时计算性能。配合纳芯微自研的 mMATH 数学加速核,可高效处理三角函数、超越函数与浮点运算,全面增强控制类应用的算力支持。集成高速 ADC 采样模块以及高精度PWM 输出模块,确保了链路的实时性。

而后,又在10月连发三款新品:中端算力新品NS800RT5075,高性价比新品 NS800RT1025、NS800RT1035。至此,NSSine系列已实现“高端-中端-入门级”全档位覆盖,全系搭载高性能Cortex-M7内核与可配置逻辑模块(CLB),兼顾了MCU的易用性与FPGA的灵活定制性于一体。


NS800RT1025/1035 功能框图,图源丨纳芯微

NS800RT5075功能框图,图源丨纳芯微
其次是极海,也是Arm路线,不过其选择了Cortex-M52内核。今年1月,极海正式发布首款基于M52双核架构的实时控制MCU——G32R501,应用范围覆盖光伏/储能逆变器、充电桩电源模块、服务器电源、车载OBC、UPS、伺服控制器、机器人等。
内核方面,根据极海的说法,G32R5系列搭载双核M52@250MHz内核,实时算力可媲美800MHz的Cortex-M7内核产品;内置单/双精度浮点运算单元(FPU),支持Arm Helium技术,显著增强高级数字信号处理(DSP)能力和机器学习(ML)应用性能,将AI算力带入更低成本、更低功耗应用产品中;,通过支持自定义数据通路CDE接口,可扩展极海自主研发的紫电数学指令扩展单元,在指令集层面支持三角函数、傅里叶变换、复杂数学等多种数学计算加速,大幅缩短数学计算时间、降低CPU访问延时,从而提升系统整体实时性和智能化。
极海和纳芯微的思路一样,也选择了内置逻辑块,不过名字有所区别——搭载4个灵活逻辑块(FLB)通过配置增强型外设互联,为片上控制外设提供高效、灵活的连接性能,从而简化系统设计并提升实时控制效率。
此外,搭载16个高分辨率PWM通道(150ps分辨率)提供极高精度和准确度的控制信号,优化系统性能,同时具备卓越的电源拓扑适应性,能够满足复杂功率管理和动态控制的需求。

G32R501 MCU特性,图源丨极海
第三是海思,其选择自研RISC-V内核。根据其官方发布的信息,Hi3065P作为高性能实时控制MCU,主要应用于数字电机控制、开关电源管理等工业场景,而Hi3065H则是支持嵌入式AI的一款实时控制专用MCU。


第四是中科昊芯,其采用了RISC-V路线,并搭载自研的H28的DSP内核。HXS320F28035是中科昊芯浮点DSC平台上的新产品,基于自主研发的H28x内核,32位浮点RISC-V DSP架构,该芯片增加了具备FPU浮点运算能力的控制律加速器(CLA),可以和H28x内核做并行计算,同时支持多种通讯端口,增强型控制外设,可满足电机驱动,光伏逆变器和数字电源等多个行业应用。

第五是国防科大派系,方案以hex/bin兼容为最大特点。
总结
实时控制领域并非非黑即白,而是存在许多不同应用场景,有些场景对于实时控制要求不一定那么高,所以一些通用MCU也可以做实时控制。但很明显,很多聚焦的场景,必须使用专用产品,所以国产厂商才通过Arm、RISC-V和自研DSP等路线切入市场。此外,国产厂商正在通过高端、中端、入门,铺开自己的覆盖范围,未来市场竞争一定会更加激烈。
参考文献
[1]TI:实时控制参考指南
[2]TI:https://www.ti.com.cn/cn/lit/wp/zhcaeq3/zhcaeq3.pdf
[3]TI:https://www.ti.com/cn/lit/wp/zhcy157/zhcy157.pdf
[4]纳芯微:https://mp.weixin.qq.com/s/mAoV9FHdyUtker8hdIXNog
[5]EEWorld:https://www.eeworld.com.cn/mcu/eic711830.html
[6]Geehy极海半导体:https://mp.weixin.qq.com/s/aL3mwjnbtKedc0GIoEetsQ
[7]土人观芯:https://mp.weixin.qq.com/s/b5Em5AMmwqmLyX1MCDTmDA
[8]芯小二的下午茶:https://mp.weixin.qq.com/s/Qgqn9AviAmrfowtlo5u9_g
· END ·