【源头活水】ICCV 2025 | 新型主干网络UniConvNet,扩展有效感受野,多个CV任务SOTA!

人工智能前沿讲习 2025-09-09 18:00


沿广注!

资讯配图
资讯配图

一、论文信息 



资讯配图

 1

论文题目:UniConvNet: Expanding Effective Receptive Field while Maintaining Asymptotically Gaussian Distribution for ConvNets of Any Scale中文题目:UniConvNet:在保持任意卷积网络渐近高斯分布的同时扩展有效感受野论文链接:https://arxiv.org/pdf/2508.09000

资讯配图

二、论文概要 



资讯配图


Highlight
资讯配图
图1. ResNet-101、SLaK-T、UniRepLKNet-T和UniConvNet-T的有效感受野(ERF)。从中心向外呈阶梯状扩展的彩色区域越明显,表明ERF的渐近高斯分布(AGD)特性越好。区域越宽表示ERF范围越大。大核卷积网络(如SLaK-T和UniRepLKNet-T)会破坏ERF的AGD特性。
资讯配图

图2. UniConvNet(本方案)与其他模型的参数量及准确率对比。圆圈面积及其中数字代表相应模型的计算量(FLOPs)。UniConvNet实现了最佳准确率-参数量与准确率-计算量的平衡。

1. 研究背景:

2. 研究方法:
资讯配图

三、实现原理 



资讯配图

 1

一、UniConvNet整体架构

资讯配图

图5. UniConvNet整体架构。

核心组件——Receptive Field Aggregator (RFA): 名为“感受野聚合器”(RFA)的模块。

  • 输入分割:将输入图像沿通道维度划分为多个部分(heads),分为A1和H1, ..., HN等多头数据流。

  • 递归处理:每个head通过“层操作符”(Layer Operator, LO)逐步递归处理,增加通道数并形成金字塔式的通道增量,从而减少参数和计算量。

  • 渐进式大核卷积:在LO中,使用逐元素乘法(Amplifier, Amp)和深度可分离卷积(Discriminator, Dis)分别扩展感受野和提供小尺度像素的影响,最终形成一个两层的AGD感受野。

资讯配图

图3. 左:感受野聚合器(RFA)。右:层操作符(LO)。

    资讯配图

    四、实验分析 



    资讯配图


    1. 图像分类:实验中开发了不同的UniConvNet变体以匹配各种当代模型的复杂度,包括最先进轻量网络和大规模网络。评估了这些变体在代表性的视觉任务上的性能并与领先的CNN和ViTs进行了比较,包括图像分类、目标检测和实例及语义分割。结果表明,所提出的模型变体在轻量场景和大规模模型中均表现出显著改进,有效弥合了两者之间的差距。
    资讯配图
    资讯配图
    资讯配图
    2. 下游任务:在COCO数据集上微调了重RetinaNet和轻SSDLite模型,使用ImageNet-1K预训练的UniConvNet。进一步使用代表性对象检测框架Mask R-CNN和Cascade Mask R-CNN微调试扩大版的UniConvNet。详细微调设置见附录。在ADE20K数据集上,使用DeepLabv3和PSPNet微调UniConvNet,并使用UperNet框架微调试扩大版的UniConvNet。详细设置见附录。
    资讯配图
    资讯配图
    资讯配图
    资讯配图

    五、结论 



    资讯配图

     1

    资讯配图

    资讯配图

    击呗!

    声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
    IC
    more
    AI ASIC:博通份额将达60%,联发科成长显著,台积电成最大赢家
    Rivian旗下工业机器人公司Mind Robotics完成5亿美元A轮融资,估值达20亿美元
    【K230新技能点亮】K230 养 “虾” 记!手把手教你部署 PicoClaw 轻量 AI 助手
    逼走 OpenClaw 后,Anthropic 还是买了一家 Agent 公司
    Omdia:近眼智能手表与公共显示应用拉动,2026年,Micro LED显示器收入达1.05亿美元
    五角大楼召见Anthropic CEO商讨AI军事用途,或将其列为“供应链风险”
    Anthropic完成300亿美元G轮融资,估值飙升至3800亿美元
    忍无可忍!Anthropic怒告五角大楼
    玻璃基Micro LED提速?天马将披露新进度
    微软发布万年级玻璃存储技术 Project Silica 实现4.84TB室温超长保存
    Copyright © 2025 成都区角科技有限公司
    蜀ICP备2025143415号-1
      
    川公网安备51015602001305号