作为现代交通基础设施的关键组成部分,高速公路在促进经济发展、便利出行、改善区域连通性和创造就业机会方面发挥着重要作用(Liu等人,2022年)。随着城市化和车辆电气化的迅速推进,高速公路的运营和管理面临着前所未有的压力(Nguyen等人,2019年)。尽管全球高速公路里程不断增加,关键路段的重建和扩建也在加速,但高速公路的发展仍然难以满足日益增长的出行需求。这导致了越来越严重的拥堵和频繁的事故(Pasidis,2019年)。在欧洲,道路占货运运输公里的50%和客运运输公里的70%,道路拥堵成本估计占发达国家的GDP的1.0-2.5%(Schubert等人,2022年)。随着COVID-19大流行的缓解,美国的高速公路拥堵小时数从2020年到2021年增加了34%,规划时间增加了10%(Robinson等人,2023年),而2023年机动车事故导致大约40,990人死亡(Chen等人,2024年)。
相关研究表明,高速公路入口匝道及其相邻的主线区域是容易发生交通事故和反复拥堵的瓶颈路段(Haule等人,2021年)。如果没有在这些区域采取积极的控制措施,拥堵很容易向上游蔓延,导致交通瘫痪和整个交通网络的恶化。智能交通系统(ITS)技术,例如主动交通控制技术,对于解决这些问题至关重要。传统的主动交通控制包括可变速度限制(VSL)控制(Khondaker和Kattan,2015a)和匝道计量(RM)控制(Papageorgiou和Kotsialos,2002)等技术。VSL和RM控制都可以调节瓶颈区域的交通流量。前者可以限制进入瓶颈区域的流量,从而防止容量下降(Chen和Ahn,2018年),而后者可以在不干扰主线交通流量的情况下将瓶颈区域的交通需求限制在容量范围内。然而,传统的交通控制技术缺乏与车辆和驾驶员的实时信息交互,难以准确感知交通流量和道路状况的变化。因此,它们在缓解交通拥堵和提高交通效率方面存在不足。因此,有必要整合新兴技术以实现更高效的主动交通控制。
通信、大数据和自动化技术的进步使得联网和自动化车辆高速公路(CAVH)系统成为智能交通系统(ITS)发展的重要方向(Li等人,2022年;Ran等人,2025年;Ran等人,2024年)。在CAVH环境中,交通控制中心(TCC)通过联网的自动化车辆(CAV)持续收集、传输和处理数据,并通过无线通信共享信息,促进了车辆之间以及车辆与路边设施之间的数据交换。这种转变意味着驾驶行为不再仅仅依赖于驾驶员的心理反应,还受到交通控制系统发出的指令的影响。一方面,这使得交通感知不再依赖于传统的固定检测器,从而提高了感知的精度。另一方面,TCC可以计算出更高效和精细的主动管理控制指令,车辆可以更高地遵守这些指令。这最大限度地利用了道路资源,减少了交通风险,并提高了交通效率。
然而,现有的主动交通控制系统仍然面临以下问题:(1)VSL控制在提高交通效率方面的有效性仍存在争议。虽然一些最近的研究试图通过分析优化VSL区域的布置(Martinez和Jin,2020年;Martinez和Jin,2018年;Wang和Cheng,2017年)或实施车道级别VSL(LVSL)方案(Lu等人,2023年;Wu等人,2020年)来提高其性能,但这些方法通常依赖于预先定义的控制区域。特别是,当前的方法往往忽略了交通流量的时变特性,无法实时动态调整控制区域的长度和覆盖范围。(2)现有的协同交通控制方法主要集中在VSL和RM策略的联合实施上,以缓解瓶颈附近的拥堵(Perraki等人,2018年;Roncoli等人,2016年)。目前仍缺乏能够联合优化多个控制维度的精细化协同控制框架,包括匝道计量率、具有可变控制区域的LVSL及其协同控制方案。这种限制限制了当前协同控制方法的可扩展性和响应能力,尤其是在复杂和高需求的情况下。(3)深度强化学习(DRL)提供了一种从高维交通状态中学习自适应控制策略的有希望的范式,无需依赖显式的建模假设。很少有研究充分利用DRL的潜力来优化上述精细化协同控制。基于DRL的协同控制架构的开发,能够联合优化多级控制决策并具有时空适应性,这一领域尚未得到充分探索。
为了解决入口匝道瓶颈附近交通拥堵和安全性的关键挑战,本研究提出了一种基于DRL的精细化协同优化控制(RSOC)方法。RSOC框架首先将控制区域离散为细粒度的车道级单元,以实现交通状态的精确表示。通过利用车对基础设施(V2I)和车对车(V2V)通信技术,实时聚合和转换车辆级别的位置和运动信息,形成宏观交通状态。首先定义了RSOC方法的关键组成部分,包括对入口匝道附近道路的细粒度车道级空间分割,从而实现准确和动态的交通状态表示。基于这一结构,制定了一个综合控制动作,综合考虑了CLVSL的连续速度限制方案、匝道计量率及其协同协调机制。为了指导学习过程,引入了一个专门设计的综合奖励函数,明确平衡了瓶颈区域内的局部运营效率与安全性以及整个系统的行驶时间。在此基础上,首次采用了演员-评论家框架,根据时空交通动态动态灵活地调整RM和CLVSL的组合和控制长度。然后使用软演员-评论家(SAC)算法来训练RSOC的演员和评论家网络,利用其在处理连续动作空间方面的强大能力。最后,通过在US101-S高速公路的真实世界瓶颈场景上进行实验来验证提出的RSOC方法。构建了一个高保真度仿真平台,结合车道级别的交通流量数据来校准微观交通模型。实验结果表明,RSOC显著缓解了拥堵波,减少了局部和系统范围内的总行驶时间,并在不同比例的联网自动驾驶车辆情况下提高了交通安全性。本文的主要贡献如下:
1.首次提出了一种结合RM控制和车道级别可变速度限制控制,并具有可调控制区域的新型RSOC框架,用于缓解瓶颈拥堵。
2.采用软演员-评论家算法来训练RSOC方法,以实现匝道计量率、连续LVSL方案及其协同策略的联合优化。
3.为RSOC设计了一个综合奖励函数,明确平衡了局部瓶颈控制与全局交通效率。
4.开发了一个协同控制仿真平台,以US101高速公路的真实世界入口匝道作为案例研究。在各种场景下进行了全面的基于仿真的评估,例如不同的交通需求和CAV渗透率。