首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 15 毫秒
1.
基于神经网络和遗传算法的机器人动态避障路径规划   总被引:8,自引:0,他引:8  
文中提出了基于神经网络和遗传算法的动态环境下机器人动态避障路径规划方法,机器人工作空间动态环境信息的神经网络模型,并利用该模型建立机器人动态避障与神经网络输出的关系,然后将需规划路径的二维编码简化成一维编码,并把动态避障要求和最短路径要求融合成一个适应度函数.通过对算法进行实验仿真,结果表明提出的动态路径规划方法是正确和有效的.  相似文献   

2.
针对局部可观测的非线性动态地震环境下,六足机器人采用传统算法进行动态避障时易出现算法不稳定的情况.运用了基于双重深度Q网络(DDQN)的决策方式,通过传感器数据输入卷积神经网络(CNN)并结合强化学习的策略,下达命令到六足机器人,控制输出决策动作,实现机器人动态避障.将系统的环境反馈与决策控制直接形成闭环,通过最大化机...  相似文献   

3.
文章首先分析了基于机械视觉避障的行为模式,结合当前的技术发展探讨出提升机器人自主学习能力以及机械视觉避障能力的有效方法,从技术层面帮助提升自主机器人的运动能力.在此基础上提出了基于机械视觉的避障技术应用措施,为机器人自动行为进行打下稳定的基础环境.  相似文献   

4.
机器人动态神经网络导航算法的研究和实现   总被引:1,自引:0,他引:1  
针对Pioneer3-DX 移动机器人, 提出了基于强化学习的自主导航策略, 完成了基于动态神经网络的移动机器人导航算法设计. 动态神经网络可以根据机器人环境状态的复杂程度自动地调整其结构, 实时地实现机器人的状态与其导航动作之间的映射关系, 有效地解决了强化学习中状态变量表的维数爆炸问题. 通过对Pioneer3-DX移动机器人导航进行仿真和实物实验, 证明该方法的有效性, 且导航效果明显优于人工势场法.  相似文献   

5.
为了解决移动机器人在复杂环境中如何高效精确地躲避障碍物的问题,提出了一种基于BP神经网络的避障方法。建立了机器人的避障运动模型并设计了神经网络避障控制系统;分析了机器人在运动过程中与障碍物的位置关系,使用超声波传感器采集距离信息,进行BP神经网络输入、输出训练并采用Matlab工具进行仿真试验。结果表明,该方法可以高效精确地实现移动机器人的自主避障,运行相对稳定、轨迹连续平滑,达到了较为理想的避障效果。验证了方法的可行性和有效性,为移动机器人自主避障提供了一种新的控制方法。  相似文献   

6.
近年来,深度强化学习的取得了飞速发展,为了提高深度强化学习处理高维状态空间或动态复杂环境的能力,研究者将记忆增强型神经网络引入到深度强化学习,并提出了不同的记忆增强型深度强化学习算法,记忆增强型深度强化学习已成为当前的研究热点.本文根据记忆增强型神经网络类型,将记忆增强型深度强化学习分为了4类:基于经验回放的深度强化学习、基于记忆网络的深度强化学习算法、基于情景记忆的深度强化学习算法、基于可微分计算机的深度强化学习.同时,系统性地总结和分析了记忆增强型深度强化学习的一系列研究成果存在的优势和不足.另外,给出了深度强化学习常用的训练环境.最后,对记忆增强型深度强化学习进行了展望,指出了未来研究方向.  相似文献   

7.
多机器人动态编队的强化学习算法研究   总被引:8,自引:0,他引:8  
在人工智能领域中,强化学习理论由于其自学习性和自适应性的优点而得到了广泛关注.随着分布式人工智能中多智能体理论的不断发展,分布式强化学习算法逐渐成为研究的重点.首先介绍了强化学习的研究状况,然后以多机器人动态编队为研究模型,阐述应用分布式强化学习实现多机器人行为控制的方法.应用SOM神经网络对状态空间进行自主划分,以加快学习速度;应用BP神经网络实现强化学习,以增强系统的泛化能力;并且采用内、外两个强化信号兼顾机器人的个体利益及整体利益.为了明确控制任务,系统使用黑板通信方式进行分层控制.最后由仿真实验证明该方法的有效性.  相似文献   

8.
本文提出了基于神经网络和粒子群优化算法的移动机器人动态避障路径规划方法。该方法用神经网络模型描述机器人工作空间的动态环境信息,并建立起机器人动态避障与网络输出间的关系,然后将需规划路径的二维编码简化为一维编码,最后用粒子群优化算法获得最优无碰路径。仿真结果表明,所提的动态路径规划方法是正确和有效的。  相似文献   

9.
受生物体神经内分泌系统调节机制的启发,提出一种神经内分泌计算模型.该模型中,内分泌系统能够对神经系统的学习与记忆行为进行反馈调控,使自主体及时调整行为,从而提高其学习和适应未知环境的能力.为了验证模型及算法的有效性,将其应用于机器人导航避障仿真实验,并与离散Q学习方法对比,结果表明该模型是有效的.  相似文献   

10.
针对变电站自动巡检这一场景,研究机器人的自主避障。当机器人的感知仅限于单目视觉时,由于缺乏3D信息,避障将变得更具挑战性。传统的路径规划等避障技术难以适用新场景。对此,提出一种基于策略迭代(DPPO)的自主避障深度强化学习模型,该模型仅以原始的RGB图像为训练数据,实现机器人的快速灵活控制。仿真实验表明,相比于基于值迭代的方法,该模型避障性能更佳。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号