在城市交通中,行人安全一直是备受关注的焦点。据统计,行人在人行横道上发生的事故占所有涉及机动车的行人事故的 86%,即便在规范使用人行横道的情况下,仍有三分之二的事故发生 。为改善这一状况,法国政府出台了一系列措施,如 2020 年 5 月 22 日立法禁止机动车在人行横道 5 米范围内停车,并要求在 2026 年底前移除所有此类停车位;2018 年法国国家道路安全委员会还建议对国内人行横道基础设施进行审计。然而,法国有数百万个人行横道,传统评估方法面临巨大的后勤挑战,难以大规模、高效地开展评估工作。
在此背景下,法国波尔多大学(University of Bordeaux)等机构的研究人员开展了一项重要研究,相关成果发表于《Heliyon》。该研究旨在利用先进的深度学习神经网络,通过分析航拍和街景图像,实现对人行横道和环形交叉路口的自动评估,以提升行人安全评估的效率和客观性。
研究人员采用了多种关键技术方法。在检测斑马(人行横道在国外常被称为斑马线)和环形交叉路口时,利用 Mask R-CNN(基于区域的卷积神经网络)进行精确分割和检测。通过 Google Maps API 收集航拍图像,随机选取法国各地城市的图像,并利用在线标注工具 MyVision 创建多边形掩码,对数据进行标注和预处理。同时,应用数据增强技术,如空间分割、缩放和旋转,增加训练数据的多样性。在分类方法上,选取影响行人过街安全的 9 个关键变量,整合 Google Maps 和 Google Street View 的数据,构建包含航拍和街景图像对的定制图像数据集。针对数据不平衡问题,采用 F1 分数、PRC-AUC(精确率 - 召回率曲线下面积)、ROC-AUC(受试者工作特征曲线下面积)等合适的评估指标,并使用二元交叉熵损失函数进行模型训练。此外,对比了 ResNet50、ResNeXt50 和 ConvNeXtV2 三种不同神经网络的性能。
在研究结果部分:
- 斑马和环形交叉路口的检测:通过损失分析可知,模型在训练过程中,各类损失均呈下降趋势,表明模型能有效学习检测和分割航拍图像中的斑马和环形交叉路口。在平均精度和召回率方面,Mask R-CNN 模型表现出色。检测斑马时,AP@[IoU:0.50:0.95] 达到 74.49%,AP50 为 97.25%,AP75 为 88.15%,平均召回率 AR@[maxDets:100] 为 76.58%;检测环形交叉路口时,对于仅包含环形交叉路口的数据集,mAP 达到 85.46%,AP50 为 91.53%,AP75 为 90.62%,AR@100 为 88.31%;对于包含环形交叉路口及周围道路的数据集,mAP 为 74.62%,AP50 为 81.61%,AP75 为 77.76%,AR@100 为 79.84%。与其他模型相比,该模型在检测环形交叉路口时也具有竞争力。
- 斑马的分类:研究评估了 ResNet50、ResNeXt50 和 ConvNeXtV2 三种模型对斑马基于不同安全相关变量的分类性能。结果显示,ConvNeXtV2 在多数任务中优于其他两种模型。例如,在检测有效斑马时,ConvNeXtV2 的 PRC-AUC 达到 0.9256,ROC-AUC 为 0.9191;在检测减速带时,其 PRC-AUC 为 0.8389;在检测交通灯和交通灯处的停车线时,PRC-AUC 分别为 0.8908 和 0.7985。然而,所有模型在检测能见度问题时都面临挑战,这是由于该变量具有主观性,注释过程中存在不一致性。
综合研究结论与讨论部分,该研究成功将先进的深度学习模型应用于行人过街和环形交叉路口的自动检测与分类,这在道路安全审计领域是一项重大进展。尽管研究过程中遇到了数据不平衡和低能见度场景难以捕捉等挑战,但研究结果表明,不同视角的训练数据有助于改善模型性能。同时,研究人员指出未来可通过数据集扩展和平衡,以及探索使用基于 Transformer 的模型(如 Vision Transformers)等先进建模技术,进一步提升模型性能,使其更适应不同地理环境,为全球道路安全干预提供更有效、更具参考价值的依据,对保障行人安全具有重要意义。