【源头活水】ICCV 2025 | 新型主干网络UniConvNet,扩展有效感受野,多个CV任务SOTA!

人工智能前沿讲习 2025-09-09 18:00


沿广注!

资讯配图
资讯配图

一、论文信息 



资讯配图

 1

论文题目:UniConvNet: Expanding Effective Receptive Field while Maintaining Asymptotically Gaussian Distribution for ConvNets of Any Scale中文题目:UniConvNet:在保持任意卷积网络渐近高斯分布的同时扩展有效感受野论文链接:https://arxiv.org/pdf/2508.09000

资讯配图

二、论文概要 



资讯配图


Highlight
资讯配图
图1. ResNet-101、SLaK-T、UniRepLKNet-T和UniConvNet-T的有效感受野(ERF)。从中心向外呈阶梯状扩展的彩色区域越明显,表明ERF的渐近高斯分布(AGD)特性越好。区域越宽表示ERF范围越大。大核卷积网络(如SLaK-T和UniRepLKNet-T)会破坏ERF的AGD特性。
资讯配图

图2. UniConvNet(本方案)与其他模型的参数量及准确率对比。圆圈面积及其中数字代表相应模型的计算量(FLOPs)。UniConvNet实现了最佳准确率-参数量与准确率-计算量的平衡。

1. 研究背景:

2. 研究方法:
资讯配图

三、实现原理 



资讯配图

 1

一、UniConvNet整体架构

资讯配图

图5. UniConvNet整体架构。

核心组件——Receptive Field Aggregator (RFA): 名为“感受野聚合器”(RFA)的模块。

  • 输入分割:将输入图像沿通道维度划分为多个部分(heads),分为A1和H1, ..., HN等多头数据流。

  • 递归处理:每个head通过“层操作符”(Layer Operator, LO)逐步递归处理,增加通道数并形成金字塔式的通道增量,从而减少参数和计算量。

  • 渐进式大核卷积:在LO中,使用逐元素乘法(Amplifier, Amp)和深度可分离卷积(Discriminator, Dis)分别扩展感受野和提供小尺度像素的影响,最终形成一个两层的AGD感受野。

资讯配图

图3. 左:感受野聚合器(RFA)。右:层操作符(LO)。

    资讯配图

    四、实验分析 



    资讯配图


    1. 图像分类:实验中开发了不同的UniConvNet变体以匹配各种当代模型的复杂度,包括最先进轻量网络和大规模网络。评估了这些变体在代表性的视觉任务上的性能并与领先的CNN和ViTs进行了比较,包括图像分类、目标检测和实例及语义分割。结果表明,所提出的模型变体在轻量场景和大规模模型中均表现出显著改进,有效弥合了两者之间的差距。
    资讯配图
    资讯配图
    资讯配图
    2. 下游任务:在COCO数据集上微调了重RetinaNet和轻SSDLite模型,使用ImageNet-1K预训练的UniConvNet。进一步使用代表性对象检测框架Mask R-CNN和Cascade Mask R-CNN微调试扩大版的UniConvNet。详细微调设置见附录。在ADE20K数据集上,使用DeepLabv3和PSPNet微调UniConvNet,并使用UperNet框架微调试扩大版的UniConvNet。详细设置见附录。
    资讯配图
    资讯配图
    资讯配图
    资讯配图

    五、结论 



    资讯配图

     1

    资讯配图

    资讯配图

    击呗!

    声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
    IC
    more
    荣耀 Magic8 Pro 再曝,400系列激活量破300万
    新品 | CoolSiC™ MOSFET 1200V分立器件TO247-4引脚IMZA封装
    【他山之石】ICCV 2025 | 换脸迈入“电影级”!小红书发布DynamicFace,统一图像视频换脸基线
    潮讯:米家App全新版本发布;华为P60、Mate50有望升级鸿蒙5;荣耀MagicOS10下周内测;传YY直播正式融入百度
    新品 | 荣耀 Magic 8 Pro 参数曝光;零跑新车曝光
    Anthropic模型自动“变笨”,从业者称“已对硅谷AI祛魅”
    【AI治理周报·9月第一期】Anthropic禁止中国控股公司使用Claude;2025世界智能产业博览会在重庆开幕
    荣耀方飞:下一代Magic系列将支持2亿长焦下的超强蓝调
    以设计为使命,用材料去启发ChrisLefteriCMF培训工作坊10月·深圳一起探索CMF的力量
    SiC价格史上首次低于IGBT!功率半导体大厂中报发生了哪些变化?
    Copyright © 2025 成都区角科技有限公司
    蜀ICP备2025143415号-1
      
    川公网安备51015602001305号