最近不少研究都能看出来,CNN和Mamba结合,是当下超热门的方向!比如TGRS 2025上的GLVMamba,通过将两者的优势融到了一起,直接在权威数据集上刷新性能纪录,稳稳站上遥感语义分割的榜首。
再加上,Mamba在视觉领域起步不算早,和CNN的融合探索才刚热起来,对论文er来说,正是好上手的时候。而且这方向有应用支撑、故事也好讲,妥妥的发文创新好路子!
目前这组合的核心创新,主要是做更智能的架构融合、拓展垂直领域应用,这些新手也能跟上。本文整理了11篇最新的CNN+Mamba论文,帮大家快速摸清前沿,还附了代码,方便复现。
扫码添加小享,回复“CM结合”
免费获取全部论文+开源代码

GLVMamba: A Global-Local Visual State Space Model for Remote Sensing Image Segmentation
方法:本文提出GLVMamba模型,结合CNN和改进的Mamba结构,通过CNN提取特征,利用GLVSS块整合全局与局部信息,用SCPP模块融合多尺度特征,提升遥感图像分割精度。

创新点:
提出GLVSS块,通过引入局部前馈反馈和移位窗口机制,解决Mamba中局部像素依赖建模不足的问题,增强全局与局部上下文信息的融合。 设计SCPP模块,充分合并多尺度特征并自适应提取区分性特征,有效减轻因光照等因素导致的孔洞和误检问题。 在Potsdam和Vaihingen数据集上的实验结果表明,GLVMamba优于其他先进方法,验证了其有效性和优越性。

TDFNet: twice decoding V-Mamba-CNN Fusion features for building extraction
方法:本文提出了一种名为TDFNet的新型建筑提取网络,该网络结合V-Mamba和CNN,通过BFM模块融合全局与局部信息,利用EDFM模块和两次解码策略增强特征学习,有效提升建筑提取精度。

创新点:
提出TDFNet,结合V-Mamba和CNN,通过BFM模块融合全局与局部信息,提升建筑提取精度。 设计EDFM模块,有效整合编码器和解码器的多阶段特征,增强模型对建筑与周围布局关系的理解,减少误提取。 实施两次解码策略,进一步学习多尺度特征,减轻树荫和阴影的影响,提高建筑提取的准确性。

扫码添加小享,回复“CM结合”
免费获取全部论文+开源代码

Hybrid CNN-Mamba model for multi-scale fundus image enhancement
方法:本文提出结合CNN和Mamba的多尺度眼底图像增强方法。利用CNN提取图像特征,Mamba处理序列数据,通过对抗训练提升图像质量,尤其在高分辨率下表现优异。

创新点:
提出结合CNN和Mamba的新型眼底图像增强模型,在低分辨率和高分辨率图像上均展现出卓越的增强效果。 引入Mamba模型进行对抗训练,进一步提升图像质量,尤其在高分辨率图像增强任务中表现出色。 在不同分辨率数据集上的有效性验证表明,该模型在下游分割任务中也具有显著优势,VSD和IOU分数均高于其他方法。

CVMFN: A Dual-Branch Remote Sensing Image Classification Model Based on CNN and Vision Mamba
方法:本文提出了一种名为CVMFN的双分支遥感图像分类模型,结合了CNN和Vision Mamba。其中ConvNeXt-T提取局部特征,Vim建模长距上下文依赖。通过特征融合模块,将两个分支的特征进行维度变换、通道拼接和卷积融合,最终通过全连接层实现分类。

创新点:
提出CVMFN双分支模型,融合CNN的局部特征提取和Vision Mamba的长距离上下文建模能力,提升分类精度。 设计特征融合模块,通过维度变换和通道拼接整合CNN与Vision Mamba的特征,增强多尺度特征表达。 在三个公共数据集上验证模型,CVMFN在不同训练比例下均优于现有先进方法,展现强大泛化能力。

扫码添加小享,回复“CM结合”
免费获取全部论文+开源代码
