航空学报 > 2023, Vol. 44 Issue (24): 328397-328397   doi: 10.7527/S1000-6893.2023.28397

基于特征增强和校准的航拍车辆实例分割方法

姚俞成, 李旭(), 徐启敏, 孔栋   

  1. 东南大学 仪器科学与工程学院,南京 210016
  • 收稿日期:2022-12-14 修回日期:2022-12-24 接受日期:2023-03-22 出版日期:2023-04-03 发布日期:2023-03-31
  • 通讯作者: 李旭 E-mail:lixu.mail@163.com
  • 基金资助:
    国家重点研发项目(22022YFC3002605);江苏省重点研发项目(BE2022053-5)

Instance segmentation for vehicle in UAV aerial images based on feature enhancement and calibration

Yucheng YAO, Xu LI(), Qimin XU, Dong KONG   

  1. School of Instrument Science and Engineering,Southeast University,Nanjing 210016,China
  • Received:2022-12-14 Revised:2022-12-24 Accepted:2023-03-22 Online:2023-04-03 Published:2023-03-31
  • Contact: Xu LI E-mail:lixu.mail@163.com

摘要:

针对航拍车辆实例分割任务中存在的车辆分布密集,遮挡,尺度变化大等挑战,提出了基于特征增强和校准的航拍车辆实例分割方法。首先,针对骨干网络提取的特征,为了充分利用其中的高层语义特征,提高不同尺度车辆的预测效果,提出多尺度语义增强模块(MSEM)。MSEM添加到特征金字塔结构最高层,通过密集连接多个不同空洞率的空洞卷积块,融合多尺度特征并使用空间注意力抑制冗余信息,减少了高层语义特征的损失,提高了特征的多尺度适应性。其次,针对特征金字塔融合后的特征,为了捕获全局特征的上下文信息,提高小尺度车辆的预测效果,同时抑制局部特征中遮挡问题引入的干扰噪声,提出全局-局部特征校准模块(GLFCM),GLFCM由全局特征校准模块(GFCM)和局部特征校准模块(LFCM)构成。GFCM使用通道注意力和自注意力实现特征层级间充分的信息交互和校准,构建全局特征图之间的依赖关系,充分挖掘了全局上下文信息;LFCM对各层级的特征分别使用多头自注意力机制Transformer进行处理,LFCM中的Transformer经过了线性化近似,相较于原始Transformer,极大减少了计算量,同时对局部特征中的遮挡干扰具有较好的抑制效果。使用航拍车辆实例分割数据集UVSD进行实验验证,所提方法对于一阶段实例分割网络YOLACT分割精度提高了5.1%,对于双阶段实例分割网络Mask R-CNN分割精度提高了2.9%,对于多阶段实例分割网络Cascade Mask R-CNN分割精度提高了1.6%,表明所提方法能显著提升航拍车辆实例分割效果。

关键词: 无人机, 计算机视觉, 实例分割, 特征增强, 注意力机制

中图分类号: