在中,我们共同探讨了太空极端环境对存储设备的严峻挑战,并对“宇航级”的定义与行业标准现状进行了深度思考。我们认识到:在商业航天时代,仅靠传统的元器件级标准已无法满足复杂模组产品的可靠性需求。
那么,如何让工业级存储器件在太空中也能可靠工作?
本期,我们将深入核心,为您揭晓 EXA TECH的系统性加固技术体系。面对工业级NAND在宇航应用中的可靠性瓶颈,EXA TECH构建了一套科学、完整的三级协同解决方案——从器件筛选到抗辐照控制器,再到系统级容错架构,每一级都针对太空环境的特定挑战进行了针对性强化。
第三章:核心挑战与EXA TECH的系统性加固方案
打造真正可靠的航天存储系统,核心在于如何弥合商用/工业级元器件(特别是NAND Flash)与太空极端环境要求之间的巨大鸿沟。EXA TECH建立了一套科学、系统的加固方法论,正视并解决了这一挑战。
3.1 核心挑战:NAND Flash 的等级限制
在宇航级SSD的研制中,最大的瓶颈在于能够满足空间大规模数据存储的宇航等级(Space-Grade) NAND Flash存储颗粒的极度匮乏。像法国3D Plus这种基于工业级2D SLC NAND颗粒打造的三维叠层封装闪存颗粒,单位体积的性能、容量密度及成本,均无法满足航天产业轻量化、低功耗及高性价比的发展需求。因此,基于批产3D工业级NAND构建面向航天的存储系统是航天存储技术发展的必然选择。

然而,工业级3D NAND的性能指标与宇航应用的严苛要求存在显著差距,其工作温度范围、抗辐照能力、长期可靠性均无法直接满足航天任务的需求。在总剂量、单粒子翻转与单粒子闩锁三大空间辐射效应中,总剂量问题可抽象为寿命问题,可通过物理冗余来解决;单粒子翻转可以通过ECC/EDC技术、多模冗余技术等予以加固,通常不会造成系统部件损坏和系统级失效事件。
单粒子闩锁可能让芯片瞬间过热,如果不能有效切断故障芯片电源,可能导致芯片损坏。同时,单粒子闩锁如果不能有效隔离,还可能拉偏系统电源,导致系统级失效事件。因此,在辐照环境下,检测并及时隔离闩锁器件是保障系统功能不中断的重要举措。器件闩锁的阈值是很重要的指标,通过定量分析,获得器件基础阈值数值,才能有效地利用控制器、RAID及分布式3级IO容错重定向技术,有效处理NAND器件闩锁效应的负面影响。
通过辐照实验发现,不同厂商不同制程不同工艺相同容量的NAND颗粒,所呈现的翻转阈值差异巨大,跨度接近一个数量级。目前对NAND器件的选项要求上,EXA TECH选定一定阈值作为单粒子翻转能力基准线。探索通过3级冗余容错机制,降低对NAND颗粒单粒子闩锁阈值的要求,特别是国产3D NAND空间应用,是EXA TECH研究工作的重点。
EXA TECH以工业级主流闪存颗粒在空间环境应用为主要研发目标,不断发展3级冗余容错网络技术,彻底解决航天产业NAND选型、国产化和供应链安全等难题。
3.2 EXA TECH的解决方案:基于全寿命期失效模型的系统性加固
面对上述挑战,简单的器件堆砌或被动防护已不足以应对。EXA TECH的解决方案是通过对选定NAND器件进行空间环境特性分析,获得定量的辐照指标数据,并建立⼀套“特性量化分析-全器件筛选-三级系统加固”的组合方法。其技术内核源于对闪存介质失效机理的深度研究,通过理论与实践结合,实现了对工业级NAND的智能化延寿与可靠性增强。

第一级:器件级加固-NAND筛选
针对工业级3D NAND闪存与宇航应用在抗辐射性、可靠性与长寿命要求方面的显著差距,EXA TECH提出—套完整的加固方案:首先通过辐照实验量化备选器件的闩锁特性等关键指标;随后对确选器件进行统计特性分析并开发针对性筛选与加固策略;最终通过在轨健康状态监测积累真实空间环境数据,形成闭环反馈以持续优化可靠性设计。
第二级:微系统级加固-抗辐照SSD控制器
控制器是SSD的“大脑”,其可靠性至关重要。EXA TECH联合体制内研究所研发的控制器采用原生抗辐照设计,具有100K总剂量、75Mev的抗辐照能力,且通过相关辐照实验验证。搭配为宇航应用订制的加固固件算法,通过软件可定义的多通道冗余技术、映射表、代码及用户数据等多模冗余技术,有效处理NAND翻转与失效问题,通过三层(分布式层、RAID层及FTL层)IO重定义技术有效处理NAND闩锁问题。
第三级:系统级加固-加固Host接口IP/RAID IP/加固块设备驱动/高可靠文件系统/分布式网络
在系统层面,EXA TECH构建了从物理失效到应用访问的完整容错体系,确保在极端情况下数据不丢失、服务不中断:
自研加固HOST SATA/HOST NVMe IP、加固块设备驱动,提高SSD访问IO路径的可靠性。
发展EXA TECH自主的smart RAID及HRFS技术,融通IO Stack下的各层级界限,目标通过统⼀逻辑编址与分布式RAID技术,可透明地屏蔽Die、Plane、坏块等级别的细微故障,并实现负载均衡。
通过分布式存储网络可以进⼀步减少对盘和RAID系统的硬件可靠性要求,最终实现完全COTS器件满足全航天数据存储应用场景需求目标。
这套“器件级-控制器微系统-RAID阵列系统-分布式网络系统”多级协同的加固体系,是EXA TECH应对航天存储挑战的核心技术支撑,也是EXA TECH将工业级NAND应用于严苛太空环境的信心来源。
通过本期的技术深潜,我们系统解析了EXA TECH如何通过三级协同的加固体系突破工业级NAND在宇航应用中的可靠性瓶颈。从器件级的科学筛选、到微系统级的抗辐照控制器设计、再到系统级的全栈容错架构,每一步都体现了工程思维与太空环境的深度对话。
当然,技术的价值最终体现在产品与实践之中。
在即将到来的第三期——也是本系列的终篇中,我们将走出实验室,走进任务场景。EXA TECH如何将这套加固体系转化为三级产品解决方案?从国家级深空探测到商业低轨星座,不同的航天任务该如何选择最合适的存储产品?我们又将如何展望宇航存储的智能未来?