基于强化学习算法的水下滑翔机路径跟踪研究 |
| |
引用本文: | 石晴晴,张润锋,张连洪,兰世泉.基于强化学习算法的水下滑翔机路径跟踪研究[J].中国机械工程,2023(9):1100-1110. |
| |
作者姓名: | 石晴晴 张润锋 张连洪 兰世泉 |
| |
作者单位: | 1. 天津大学机械工程学院机构理论与装备设计教育部重点实验室;2. 天津理工大学天津市先进机电系统设计与智能控制重点实验室;3. 机电工程国家级实验教学示范中心(天津理工大学);4. 青岛海洋科学与技术试点国家实验室海洋观测与探测联合实验室 |
| |
摘 要: | 针对洋流影响下水下滑翔机实际路径与预定路径偏差较大的问题,在传统的长短期记忆网络模型的基础上引入注意力机制,建立了具有长短期记忆与注意力机制的神经网络洋流预测模型;利用深度神经网络生成水下滑翔机运动的动态Q表,并通过强化学习算法选择最优运动姿态,同时考虑洋流的影响,构造了基于深度强化学习的水下滑翔机路径跟踪算法。结果表明,基于注意力机制的长短期记忆网络相较于传统的整合移动平均自回归模型与长短期记忆网络,其洋流预测具有更小的均方误差与均方根误差,具有良好的预测能力;相较于传统的PID控制,深度强化学习模型可使水下滑翔机轨迹均方根误差降低50.9%,显著提高了路径跟踪精度。
|
关 键 词: | 水下滑翔机 路径跟踪 注意力机制 强化学习 |
|
|