摘要: 面向无人机在复杂环境下的精准感知需求,可见光与红外双模态融合检测技术因其显著的互补优势而备受关注。当前方法在应对航拍场景中模态特征异构、背景干扰复杂及小目标特征微弱等挑战时,往往难以同时达成高精度与高效率的平衡。针对这一问题,本文提出一种基于跨模态共模交互与差分感知的目标检测方法。首先,针对跨模态特征对齐难题,设计了双向跨模态共模融合(Bidirectional-Cross-Modal Common Mode Fusion, BCMF)模块,通过双向注意力机制实现可见光与红外模态的深层交互与共性特征提取。其次,为抑制复杂背景噪声并增强目标显著性,构建了上下文门控差分增强(Context-Gated Differential Block, CGDB)模块,利用大感受野上下文信息对特征进行自适应门控筛选。进一步,为提升多尺度特征判别力,采用双FPN结构,独立维护并融合双模态特征流,避免特征混淆。在DroneVehicle与VEDAI数据集上的实验表明,所提方法在取得高平均精度的同时,保持了模型轻量化,其综合性能较现有主流融合方法有较大幅度提升。
中图分类号: