首页 | 官方网站   微博 | 高级检索  
     

强化学习的自动驾驶控制技术研究进展
引用本文:潘峰,鲍泓. 强化学习的自动驾驶控制技术研究进展[J]. 中国图象图形学报, 2021, 26(1): 28-35
作者姓名:潘峰  鲍泓
作者单位:北京化工大学, 北京 100029;北京联合大学, 北京 100101
基金项目:国家自然科学基金项目(61932012);北京市教委科技计划一般项目(KM201911417009)
摘    要:自动驾驶车辆的本质是轮式移动机器人,是一个集模式识别、环境感知、规划决策和智能控制等功能于一体的综合系统。人工智能和机器学习领域的进步极大推动了自动驾驶技术的发展。当前主流的机器学习方法分为:监督学习、非监督学习和强化学习3种。强化学习方法更适用于复杂交通场景下自动驾驶系统决策和控制的智能处理,有利于提高自动驾驶的舒适性和安全性。深度学习和强化学习相结合产生的深度强化学习方法成为机器学习领域中的热门研究方向。首先对自动驾驶技术、强化学习方法以及自动驾驶控制架构进行简要介绍,并阐述了强化学习方法的基本原理和研究现状。随后重点阐述了强化学习方法在自动驾驶控制领域的研究历史和现状,并结合北京联合大学智能车研究团队的研究和测试工作介绍了典型的基于强化学习的自动驾驶控制技术应用,讨论了深度强化学习的潜力。最后提出了强化学习方法在自动驾驶控制领域研究和应用时遇到的困难和挑战,包括真实环境下自动驾驶安全性、多智能体强化学习和符合人类驾驶特性的奖励函数设计等。研究有助于深入了解强化学习方法在自动驾驶控制方面的优势和局限性,在应用中也可作为自动驾驶控制系统的设计参考。

关 键 词:自动驾驶  决策控制  马尔可夫决策过程  强化学习  数据驱动  自主学习
收稿时间:2020-07-30
修稿时间:2020-10-23

Research progress of automatic driving control technology based on reinforcement learning
Pan Feng,Bao Hong. Research progress of automatic driving control technology based on reinforcement learning[J]. Journal of Image and Graphics, 2021, 26(1): 28-35
Authors:Pan Feng  Bao Hong
Affiliation:Beijing University of Chemical Technology, Beijing 100029, China;Beijing Union University, Beijing 100101, China
Abstract:
Keywords:autonomous driving  decision control  Markov decision process(MDP)  reinforcement learning(RL)  data-driven  autonomous learning
点击此处可从《中国图象图形学报》浏览原始摘要信息
点击此处可从《中国图象图形学报》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号