一种基于改进YOLOv10的目标检测算法
夏语遥,王树梅
(江苏师范大学 计算机科学与技术学院,江苏 徐州 221000)
摘 要:伴随自动驾驶技术向L4/L5级别演进,提高低光照、高度遮挡及多尺度目标场景下视觉感知系统的检测抗干扰性已成为核心难题.针对YOLOv10模型在复杂环境条件下特征表达能力不足、多尺度融合效率受限的问题,提出一套轻量化结构优化方案.该方案在主干网络中嵌入CaFormer模块,并基于MetaFormer框架融合通道注意力机制与深度可分离卷积,借助“令牌混合器+通道处理器”的范式提升上下文语义建模能力;在特征融合阶段引入双向加权特征金字塔网络(BiFPN),利用可学习权重动态调整自顶向下与自底向上路径的特征交互,提升小目标与弱特征目标检测的精度.与基准模型(YOLOv10)相比,改进模型(YOLOv10-BiFPN-CaFormer)在原始数据集上的mAP@0.5达到95.8%,在KITTI数据集上也达到95.9%;即使在极端光照条件下(ExDark数据集),精度(P)仍达到0.69.实验结果表明,改进模型可协调发挥CaFormer与BiFPN的作用,较好达成检测精度和推理效率的协同优化.
关键词:目标检测; YOLOv10; CaFormer; BiFPN;智能驾驶