视频「缺陷」变安全优势:蚂蚁数科新突破,主动式视频验证系统RollingEvidence

机器之心 2025-08-26 12:08
资讯配图


近日,蚂蚁数科 AIoT 技术团队独立完成的论文《RollingEvidence: Autoregressive Video Evidence via Rolling Shutter Effect》被网络安全领域学术顶会 USENIX Security 2025 录用。


该论文提出了一套创新性的主动式可信视频取证系统,利用相机卷帘门效应在视频中嵌入高维物理水印,并结合 AI 技术与概率模型进行精准验证,能够有效抵御深度伪造(Deepfake)和视频篡改等攻击。相较于传统被动识别技术,该系统在检测准确率和安全防护能力上均有显著提升。


会议简介:USENIX Security 于 1990 年首次举办,已有三十多年历史,与 IEEE S&P、ACM CCS、NDSS 并称为信息安全领域四大顶级学术会议,也是中国计算机学会(CCF)推荐的 A 类会议,本届会议的论文录用率为 17.1%,被录用的稿件反映了网络安全领域国际前沿研究水平。


资讯配图



在深度伪造(Deepfake)与视频篡改日益泛滥的今天,真实性的边界正在被不断挑战。对此,蚂蚁数科 AIoT 技术团队提出了一项突破性创新 ——RollingEvidence,一种将 CMOS 摄像头 “缺陷” 转化为安全优势的主动式视频验证算法和系统。


它巧妙地利用相机卷帘门效应,在每一帧画面中实时注入滚动的条纹探测信号,就像为视频嵌入 “数字脉搏”。这些高维探测信息通过自回归加密机制动态演化,确保内容不可伪造、篡改可追溯。在验证端,深度神经网络与概率模型智能推断协同运作,对视频内容验证信息对齐,精准锁定异常帧。论文从理论证明、原型实现、大规模实验三个方面共同验证了其在视频真实性保障上的卓越性能。


整体方案


当前,摄像头设备已无处不在,其生成的视频证据在司法审判、公共安全及法律实务中发挥着关键作用。然而,随着 Sora、Pika 等 AI 视频生成技术和深度伪造(Deepfake)技术的持续突破,视频证据的真实性保障正面临严峻挑战。


本文提出 RollingEvidence 系统,这是一种通过自回归方式将物理探针与视频内容主动耦合的创新方案,可构建具备内在保护机制的视频证据。具体而言,在摄像过程中,我们通过动态调节 LED 设备产生人眼不可见的变频闪烁信号,结合相机逐行曝光的特性,将探针以条纹模式嵌入视频帧中。在验证阶段,我们开发了专用深度网络提取条纹特征并解码探针信息,进而基于指数最小蕴涵算法识别可能被篡改的帧。


通过理论分析、原型系统及大量实验,我们验证了 RollingEvidence 在生成和验证可信视频证据方面的有效性。该系统可广泛应用于公证认证、身份核验及司法取证等关键场景。


资讯配图


相机卷帘门效应


卷帘快门效应是指 CMOS 传感器采用逐行扫描方式曝光时,由于扫描时序与物体运动或光源频率不匹配,导致动态物体出现形变(如拍摄旋转风扇)或产生时域混叠现象(如拍摄闪电)。


资讯配图

(注:以上图片中的风扇和闪电等图片来自网络)


本研究创新性地利用这种时域混叠特性,通过自回归建模将验证探针嵌入视频信号中。


资讯配图
资讯配图


探针包的设计


在可见光通信(VLC)系统中,通常采用多周期发送、数据重传等策略来确保数据完整性和传输速率。而 RollingEvidence 系统专注于视频帧篡改检测,无需考虑通信传输问题,因此可以采用更紧凑的高维探针定义方案。具体实现上,我们采用带分隔频率的频移键控(FSK)技术,使用 16 种不同频率构建 4096 种探针组合(涵盖从单频到四频的所有排列组合)。


资讯配图
资讯配图


LED 调制频率设定


对于具有不同读出时间的相机,我们固定曝光时间并在设置阶段调整频率字典,以确保深度学习网络获得一致的条纹图案。


资讯配图


在原型系统中,L=16,w0=100,我们使用 16 种固定条纹宽度阵列,起始宽度为 100 像素,并以 5 像素为增量递增。为确定相机曝光时间,我们提出了关于条纹像素强度与曝光时间比例的上下界新发现:


资讯配图


即要维持与曝光时间 Te 成正比的高对比度(∝ Te)—— 这对可靠提取条纹图案至关重要 —— 工作频率必须保持在 1/2Te 以下。我们选择分隔频率因其独特性:在保持足够强度(∝ 2Te/3)的同时,提供更窄的宽度(≈34 像素)和相对更高的对比度(∝ Te/3)。


资讯配图


二阶段工作流程


RollingEvidence 采用随机采样编码技术,将紧凑的高维探针嵌入后续每一帧视频中,确保帧与帧之间、以及与设备加密密钥的关联性。在验证阶段,我们开发了专用的深度神经网络,用于提取条纹特征并解码探针信息,进而基于指数最小蕴涵算法识别可能被篡改的视频帧。同时,RollingEvidence 会生成去条纹化的视频版本,确保画面清晰可供人工查看。


资讯配图


自回归随机编码


在编码阶段,我们采用自回归模式。在摄像头端,视频流经过动态分割处理,生成一系列相邻窗口重叠一帧的窗口序列。对于每个新构建的窗口,都会生成一个随机序列作为对齐基准。该随机序列还与摄像头和 LED 的加密密钥相关联。我们会随机创建一个辅助 λ 序列,并应用指数最小采样法,根据相关窗口的随机序列来选择下一个探针。根据指数最小技巧,最小值运算会产生与多重分布相同的多项式分布,从而生成足够随机的观测值来防范潜在攻击。另一个重要含义是,我们的策略倾向于采样较大的随机值,这将用于识别被篡改的帧。


资讯配图


提取条纹的神经网络


录制完成后,系统进入验证阶段。我们采用批量解码而非逐频解调的方式处理探针:针对每一帧视频,首先提取条纹强度曲线,定位分隔标识并裁剪特征区域,最终解码获得探针信息。这一过程通过我们构建的新型深度神经网络实现。该网络以连续三帧为输入,在提取条纹强度曲线的同时,还能生成无条纹的视频版本。之所以能输出既清晰又真实的画面,关键在于 LED 调制图案以毫秒级速度切换,确保没有任何像素位置会在多帧中持续出现条纹遮挡。


资讯配图


基于此,我们提出了行注意力模块:一方面提升去条纹后的整体画面清晰度,另一方面帮助后续模块聚焦于亮度较高的图像行区域。


资讯配图


模式切分和探针解码


基于提取的光强度曲线,我们可以分割探针模式,随后通过预训练的分类神经网络从曲线模式中解码出探针信息。


资讯配图


篡改检测


在验证阶段,我们按照编码流程重建视频帧窗口及其对应的随机序列。针对每个帧窗口,我们评估其随机序列与从后续窗口提取的解码探针之间的匹配程度。根据以下公式递增窗口支持度:其中预定义参数 q 表示对均匀随机采样值特定分位数(如 98%)的显著性阈值。该方法可理解为针对指数分布的单尾检验。


资讯配图


篡改检测的性能表现


我们通过两组实验评估 RollingEvidence 的篡改检测性能:首组测试针对视频帧的插入、删除和修改操作,次组测试聚焦人脸替换与唇形同步检测。实验结果表明,该系统能准确识别大多数篡改行为,且不会对正常视频产生误判。


资讯配图


验证子模块的性能表现


我们同时评估了系统的验证子模块性能。测试涵盖 13 种室内场景和 3 种室外场景下的强度曲线提取与去条纹视频生成效果。左图为原始采集帧,中图为深度网络生成的去条纹帧,右图为基准真值。我们采用均方误差 (MSE) 评估条纹提取精度,以结构相似性 (SSIM) 衡量去条纹效果。实验表明:尽管存在背景和环境光照变化,深度网络提取的条纹特征仍与真实数据高度吻合,且去条纹处理效果优异。


资讯配图


总结


本研究提出了一种基于卷帘快门效应的防篡改视频录制系统,创新点包括:1) 在物理层嵌入防篡改探针;2) 采用自回归编码方案,利用前序帧和设备密钥生成高效探针;3) 设计多任务深度网络,提取条纹模式、解码探针并检测篡改;4) 实现原型系统,并通过实验验证了 RollingEvidence 框架的高效性和安全性。


资讯配图


© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:liyazhou@jiqizhixin.com

声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
安全
more
公众接受eVTOL前,安全“红线”该划多高?
【报告】安全专题四:2025网络安全重要趋势(附PDF下载)
2025年中国数据存储行业现状与竞争格局分析,呈现出大容量、高性能、安全可靠、绿色低碳和开放生态等发展趋势「图」
高志凯:英伟达应该向中国缴纳15%的安全保证金
低空经济爆发前夜!国新办发布会释放关键信号;AG600雷电试验破局,低空安全认证迈入AI时代
空管系统迎来升级!中央空管委部署低空安全网,你的企业准备好了吗?
5.28秒破百,综合续航超1200km,安全配置还全面!
国家级认可!百度大模型安全护栏获工信部等十四部门正式授牌
【AI大模型展】蜜巢大模型——自主安全双引擎,应用丰富落地强
安全、耐用,省心缺一不可的SUV怎么选?
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号