融入驾驶员感知模型的智能车辆左转决策研究 |
| |
引用本文: | 邱思远,王孝兰,张伟伟.融入驾驶员感知模型的智能车辆左转决策研究[J].智能计算机与应用,2024(1):180-184+190. |
| |
作者姓名: | 邱思远 王孝兰 张伟伟 |
| |
作者单位: | 上海工程技术大学机械与汽车工程学院 |
| |
摘 要: | 智能车辆左转是最为复杂的驾驶任务之一,现有的基于强化学习的智能车辆左转决策模型,将上流感知模块的输出直接作为左转决策算法的状态空间,与人类驾驶员相比缺乏对感知信息的筛选和推理,使得决策算法很难收敛到一个较优的决策策略。本文通过对驾驶员感兴趣区域建模,将其融入基于近端策略优化(PPO)强化学习的决策算法中,过滤掉冗余的感知信息,使智能车辆关注对决策有用的信息区域;为了充分考虑周边车辆的交互关系,将注意力机制加入基于PPO的强化学习决策算法中;从智能车辆的安全、高效和舒适的3个方面设计奖励函数,以引导智能车辆的学习方向。实验结果表明,融入驾驶员感兴趣区域模型和注意力机制的决策框架优于其他的基线框架,收敛速度更快,提高了智能车辆决策的安全性和通行效率。
|
关 键 词: | 智能车辆 强化学习 PPO 决策模型 |
|
|