首页 | 官方网站   微博 | 高级检索  
     

基于深度强化学习的无人机矿井自主巡航研究
引用本文:沈凡凡,杨博帆,梁琦玮,惠丽洁,徐超.基于深度强化学习的无人机矿井自主巡航研究[J].武汉大学学报(理学版),2023(2):205-214.
作者姓名:沈凡凡  杨博帆  梁琦玮  惠丽洁  徐超
作者单位:南京审计大学计算机学院
基金项目:国家自然科学基金(61902189,71972102);;江苏省高等学校基础科学(自然科学)研究项目(22KJA520004);;江苏省研究生科研与实践创新计划(SJCX22_1000);;江苏省教育科学“十四五”规划2021年度重点课题(C-b/2021/01/26);
摘    要:针对目前矿井传感器所收集数据的传输效率差、实时性低、丢包率高等问题,提出了一种基于深度强化学习的无人机矿井自主巡航解决方法,以有效收集物联网节点数据。该方法以无人机作为传输中介,根据矿井物联网节点数据生成周期性的不同差值,利用强化学习TD3(Twin Delayed Deep Deterministic policy gradient algorithm)算法实现无人机最优路径规划。同时算法考虑并设计了符合矿井实际场景的环境、奖励值、状态信息等。提出了一种预测等待的方法,预测待采集数据产生时间并确定目标节点,无人机在信号覆盖范围内前往目标节点提前等待,以实时获取矿井传感器的生成数据。实验结果表明,无人机能够自主决策实现最优路径规划,并收集节点数据;在训练回合为700时,奖励值达到峰值,算法达到收敛并具备优异的表现。

关 键 词:矿井  深度强化学习  无人机  路径规划
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号