排序方式: 共有41条查询结果,搜索用时 15 毫秒
1.
基于目标导向行为和空间拓扑记忆的视觉导航方法 总被引:1,自引:0,他引:1
针对在具有动态因素且视觉丰富环境中的导航问题,受路标机制空间记忆方式启发,提出一种可同步学习目标导向行为和记忆空间结构的视觉导航方法.首先,为直接从原始输入中学习控制策略,以深度强化学习为基本导航框架,同时添加碰撞预测作为模型辅助任务;然后,在智能体学习导航过程中,利用时间相关性网络祛除冗余观测及寻找导航节点,实现通过情景记忆递增描述环境结构;最后,将空间拓扑地图作为路径规划模块集成到模型中,并结合动作网络用于获取更加通用的导航方法.实验在3D仿真环境DMlab中进行,实验结果表明,本文方法可从视觉输入中学习目标导向行为,在所有测试环境中均展现出更高效的学习方法和导航策略,同时减少构建地图所需数据量;而在包含动态堵塞的环境中,该模型可使用拓扑地图动态规划路径,从而引导绕路行为完成导航任务,展现出良好的环境适应性. 相似文献
2.
为提高机器人自主学习能力,提出一种基于奖励引导的机器人自主步态学习算法.首先给出自主设计的机械式步态同步六足机器人的机械结构,其独特的多层钢堆叠腿部设计方案和特有的机械同步传动方案为机器人后续步态学习研究奠定良好基础;接下来提出一种基于奖励引导的机器人步态学习算法,该算法可以让机器人在未知环境中进行技能学习;最后,在MATLAB和ADAMS联合仿真平台上进行算法验证实验,实验结果显示以速度和高度分别为主评价指标会呈现出2种合理的收敛结果,且在该算法下六足机器人可以自主学习到翻越木块的高难度技能. 相似文献
3.
4.
系统地介绍了在中文windowsXP操作系统下,利用普通键盘,处理日文时的日文符号罗马字读音输入法。 相似文献
6.
为解决移动机器人未知环境下的路径规划问题,提出基于子目标搜索的机器人目标导向RRT(rapidly- exploring random trees)路径规划算法.一方面,针对传统RRT算法固有的盲目搜索问题,引入目标导向函数,形成目标导向RRT路径规划算法,这一改进可减少冗余搜索,提高路径规划效率;另一方面,为了使机器人在首次探索未知环境时也能顺利抵达目标点,提出3种不同情况下的子目标搜索策略,包括无障碍环境下的直达策略、扫到边界点时的最短距离策略和扫不到边界点时的后退策略,这3种策略使机器人能够完成对未知环境的探索,而且可以克服易出现的局部极小点问题,使机器人具有逃离局部极小环境的能力.仿真实验结果验证了所提出算法的可行性和有效性. 相似文献
7.
分析区域降水的时空演变特征,对了解区域水文水资源未来情势变化、制定科学的水资源利用和防汛抗旱决策具有重要意义。基于1960—2016年共57年深圳市水文测站降水量系列资料,采用经验正交函数分解分析了深圳市年降水量的空间分布特征,并借助Mann-Kendall,Spearman非参数检验、累积距平和小波分析等多种方法,从趋势变化、突变特征和周期波动等方面研究年降水量时程演变特征,初步分析了变化成因。研究结果表明:57年来深圳市年降水量空间上具有较明显的两种分布型态,时程上不存在显著的趋势变化,但在局部时段上呈现出以1991年或2004年前后为突变点、先降后升的阶段性变化;深圳市年降水量普遍存在17~20年、5~7年的显著准周期,未来深圳区域年降水量在2016年之后将会维持一段时间的偏丰状态。 相似文献
8.
足球是一项颇受人们喜爱的运动项目。当今很多学校都将足球运动引入到实际教学当中,足球运动的发展已经被相关专家所广泛关注。结合实际情况,本文对当前我国足球教学中存在的弊端进行简要介绍,对在足球教学中几个教学方法进行详细介绍,并针对教学方法的改革提出了相关建议。 相似文献
9.
哺乳动物的运动学习机制已得到广泛研究,犬科动物可以根据环境反馈的引导性信息自主地学习运动技能,对其提供更为特定的训练引导可以加快其对相关任务的学习速度.受上述启发,在软演员-评论家算法(SAC)的基础上提出一种基于期望状态奖励引导的强化学习算法(DSG-SAC),利用环境中的状态反馈机制来引导四足机器人进行有效探索,可以提高四足机器人仿生步态学习效果,并提高训练效率.在该算法中,策略网络与评价网络先近似拟合期望状态观测与当前状态的误差,再经过当前状态的正反馈后输出评价函数与动作,使四足机器人朝着期望的方向动作.将所提出算法在四足机器人上进行验证,通过实验结果可知,所提出的算法能够完成四足机器人的仿生步态学习.进一步,设计消融实验来探讨超参数温度系数和折扣因子对算法的影响,实验结果表明,改进后的算法具有比单纯的SAC算法更加优越的性能. 相似文献
10.
数据关联是移动机器人同时定位与地图构建(SLAM)中状态估计的前提和基础,针对当前联合兼容分支定界算法存在计算复杂度高、耗时长的问题,提出了基于高斯混合模型(GMM)最大期望聚类分组的SLAM数据关联算法.首先,为减少同一时刻参与关联的观测值数目,在局部区域内采用GMM最大期望聚类算法对当前时刻的观测值进行分组;其次,在各观测小组中采用联合兼容分支定界算法进行数据关联;最后,综合各观测小组的观测值同局部地图特征得到的关联解,得到最优的关联结果.仿真实验结果表明,基于高斯混合模型最大期望聚类分组的SLAM数据关联算法在保证数据关联准确度的前提下,计算复杂度得到了降低,缩短了运行时间. 相似文献