强化学习的自动驾驶控制技术研究进展 Research progress of automatic driving control technology based on reinforcement learning期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

强化学习的自动驾驶控制技术研究进展

引用本文：	潘峰,鲍泓. 强化学习的自动驾驶控制技术研究进展[J]. 中国图象图形学报, 2021, 26(1): 28-35

作者姓名：	潘峰鲍泓

作者单位：	北京化工大学, 北京 100029;北京联合大学, 北京 100101

基金项目：	国家自然科学基金项目（61932012）；北京市教委科技计划一般项目（KM201911417009）

摘要：	自动驾驶车辆的本质是轮式移动机器人，是一个集模式识别、环境感知、规划决策和智能控制等功能于一体的综合系统。人工智能和机器学习领域的进步极大推动了自动驾驶技术的发展。当前主流的机器学习方法分为：监督学习、非监督学习和强化学习3种。强化学习方法更适用于复杂交通场景下自动驾驶系统决策和控制的智能处理，有利于提高自动驾驶的舒适性和安全性。深度学习和强化学习相结合产生的深度强化学习方法成为机器学习领域中的热门研究方向。首先对自动驾驶技术、强化学习方法以及自动驾驶控制架构进行简要介绍，并阐述了强化学习方法的基本原理和研究现状。随后重点阐述了强化学习方法在自动驾驶控制领域的研究历史和现状，并结合北京联合大学智能车研究团队的研究和测试工作介绍了典型的基于强化学习的自动驾驶控制技术应用，讨论了深度强化学习的潜力。最后提出了强化学习方法在自动驾驶控制领域研究和应用时遇到的困难和挑战，包括真实环境下自动驾驶安全性、多智能体强化学习和符合人类驾驶特性的奖励函数设计等。研究有助于深入了解强化学习方法在自动驾驶控制方面的优势和局限性，在应用中也可作为自动驾驶控制系统的设计参考。
关键词：	自动驾驶决策控制马尔可夫决策过程强化学习数据驱动自主学习
收稿时间：	2020-07-30
修稿时间：	2020-10-23
Research progress of automatic driving control technology based on reinforcement learning

Pan Feng,Bao Hong. Research progress of automatic driving control technology based on reinforcement learning[J]. Journal of Image and Graphics, 2021, 26(1): 28-35

Authors:	Pan Feng Bao Hong

Affiliation:	Beijing University of Chemical Technology, Beijing 100029, China;Beijing Union University, Beijing 100101, China

Abstract:

Keywords:	autonomous driving decision control Markov decision process(MDP) reinforcement learning(RL) data-driven autonomous learning

	点击此处可从《中国图象图形学报》浏览原始摘要信息
	点击此处可从《中国图象图形学报》下载免费的PDF全文

设为首页 | 免责声明 | 关于勤云 | 加入收藏