首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 682 毫秒
1.
针对传统深度强化学习中移动机器人在稀疏奖励环境下只有在规定时间步内到达目标位置才能得到积极奖励,中间过程的每一步都是负面奖励的路径规划问题.提出了基于改进深度Q网络的路径规划方法,在移动机器人在探索过程中,对以真实目标为条件的轨迹进行采样,在经验回放过程中,把移动机器人已经到达的状态来代替真正的目标,这样移动机器人可以获得足够的积极奖励信号来开始学习.通过深度卷积神经网络模型,将原始RGB图像作为输入,通过端对端的方法训练,利用置信区间上界探索策略和小批量样本的方法训练神经网络参数,最后得到上、下、左、右4个动作的Q值.在相同的仿真环境中结果表明,该算法提升了采样效率,训练迭代更快,并且更容易收敛,避开障碍物到达终点的成功率增加40%左右,一定程度上解决了稀疏奖励带来的问题.  相似文献   

2.
针对深度强化学习视觉导航算法因导航场景变化而导致导航精度下降,影像匹配的实时性和可靠性降低的问题,提出一种融合拆分注意力机制和下一次预期观测(NEO)的视觉导航模型。首先使用ResNest50骨干网络提取当前状态和目标状态的特征以降低网络冗余,利用跨阶段部分连接CSP强化捕获浅层目标特征信息以增强模型的学习能力。然后提出改进的损失函数,使得推理网络更加接近于真实后验,从而智能体能在当前环境下做出最佳决策,进一步提升不同场景下模型的导航精度。在AVD数据集和AI2-THOR场景进行训练及测试,实验结果表明,本文算法导航精度高达96.8%,平均SR提升约3%,平均SPL提升约6%,可以满足导航精度和实时匹配的要求。  相似文献   

3.
针对移动机器人在未知复杂环境中动态目标跟踪存在的数值不稳定、计算量大和精度较差等问题,提出基于平方根容积卡尔曼滤波的移动机器人动态目标跟踪算法(SR-CKF-SLAM-OT)。该算法的系统状态由地图环境特征、机器人和目标作为一个整体构成。建立目标和机器人的动态模型进行预测、数据关联和更新,在更新过程中直接传递目标状态均值和协方差矩阵的平方根因子,降低了计算的复杂度。此外,通过数据关联环节能够有效的降低伪观测值对系统状态估计的影响。仿真结果表明:相比基于EKF的动态目标跟踪算法,所提出的动态目标跟踪算法目标和机器人均方根误差分别降低了36.3%和38.2%,SR-CKF-SLAM-OT算法有效地满足了移动机器人动态目标跟踪的需求。  相似文献   

4.
针对移动机器人在状态突变时同步定位与地图构建精度下降的问题,提出了强跟踪平方根容积卡尔曼滤波SLAM算法(STF-SRCKF-SLAM)。该算法首先根据移动机器人的运动学模型和观测模型进行预测,然后通过直接传播误差协方差矩阵的平方根因子进行更新,使计算复杂度大大降低。同时在预测和更新过程中引入时变渐消因子,实时调整相应数据权值,达到提高机器人定位精度的目的。仿真实验结果表明,相比容积卡尔曼滤波SLAM算法(CKF-SLAM)、平方根容积卡尔曼滤波SLAM算法(SRCKF-SALM),STF-SRCKF-SLAM算法均方根误差降低了26.25%和13.8%,运行时间减少了1.83%和1.21%,表明该算法在SLAM性能上更优。  相似文献   

5.
在未知环境中,移动机器人的同步定位与地图创建是机器人研究领域的一个非常重要的问题.作为自主机器人,能够可靠地探索未知环境中的目标或局部环境,是否具有视觉信息采集能力是非常重要的,基于尺度不变的特征变换算法(SIFT)在图像匹配与检测方面具有强大的功能.提出了一种方法来优化SIFT特征向量的维度,降低算法的复杂度,提高算...  相似文献   

6.
房群 《电工技术》2024,(2):97-100
电动汽车的随机充电与光伏出力的波动特性给光储式充电站的经济高效运行提出了新的要求.为此,提出 了一种基于深度强化学习近端策略优化(ProximalPolicyOptimization,PPO)算法的光储式充电站储能运行策略.首 先,对光储式充电站系统结构进行了分析,并建立了以综合运行成本最小为目标的储能运行模型.其次,将该模型转 化为马尔科夫决策过程,并采用深度强化学习PPO算法进行训练求解.最后,在一个光储式充电站中进行算例仿真, 验证所提策略的有效性.  相似文献   

7.
针对多因素互影响造成负荷预测精度低的问题,提出一种基于特征相关分析修正与全局粒子群优化(GPSO)的长短期记忆循环神经网络(LSTM)短期负荷预测新方法.该方法首先对负荷相关序列进行探索性数据分析(EDA)及预处理,找寻特征内在机理与相关联系并加以修正,保证输入特征的强相关性和完整性.针对传统前馈神经网络无法处理序列关联信息和普通循环神经网络无法记忆久远关键信息的缺陷,构建基于LSTM负荷预测模型进行深度学习.由于LSTM网络权值的随机初始化,使得目标函数在训练过程中易陷入局部最优,利用改进粒子群算法优化预测模型的网络权值,提升模型整体预测能力.与反向传播神经网络(BPNN)和递归神经网络(El-man)的基准模型相比,所提模型方法的预测精度提高显著.  相似文献   

8.
针对无人机易受GPS欺骗干扰的问题,提出一种基于长短时记忆法(LSTM)的无人机全球定位系统(GPS)欺骗干扰检测模型。为了提高模型训练精度,首先利用时序生成对抗网络(TimeGAN)对训练数据集进行了数据增强工作,弥补了训练数据量的不足,还对比了增强数据集与原始数据集的性能差距。然后搭建了LSTM模型,在仿真实验下TimeGAN+LSTM模型获得的准确率、精确率、召回率和F1值分别为98.08%、98.55%、98.07%和98.31%。最后与传统机器学习模型进行比较,对比结果证明,提出的欺骗干扰检测模型拥有更好的性能指标。该模型可实现对无人机GPS欺骗干扰信号的有效检测。  相似文献   

9.
近年来,随着神经网络和深度学习在工业工程中广泛应用,计算机视觉算法在边缘端计算方面得到了极大提高.在计算机视觉领域,传统的目标检测方法通常基于低层特征训练一个特定类别的学习(如 SVM),通过滑动局部窗口来检测单个类别的图像,因此可能不适用于灵敏度高、目标类型多、环境复杂的电网故障图像.对此提出在 YOLOv3算法中加入FPN (特征金字塔)和 Anchor的 K-means聚类,使整个改进的 YOLOv3算法在电气多类故障检测上比传统方法更高效、更准确.从技术角度讲,使用darknet框架并行训练 YOLOv3模型,在训练过程中将小批量提升到128张,改进的 YOLOv3能同时快速检测出熔断器断开故障.  相似文献   

10.
提出一种结合莱维飞行和概率路线图法(Lévy-probabilistic roadmap, LPRM)的路径规划算法。将莱维飞行方法应用于窄道采样,障碍物中的随机点通过莱维飞行走至自由空间,并延长碰撞测试来确保采样点位于窄道内,提升狭窄区域的采样质量与效率;为避免大量无效点的生成,在采样前先对地图进行预处理,膨胀障碍并对其进行边界提取,根据边界信息计算狭窄区域采样点数量,保证了全图采样的合理分布;进一步考虑移动机器人的实际工作情况,采用分段贝塞尔曲线对路径轨迹进行优化使其符合运动学约束,提高移动机器人的机动性。仿真实验在不同环境地图下对比了LPRM、传统概率路线图(PRM)和桥测试3种算法,结果表明LPRM算法相较两者在单一窄道环境下规划效率分别提升35.1%和32.2%,在复杂环境下其规划效率分别提升32.9%和15.5%,且提前400和100个采样点达到收敛,规划效率和成功率显著提高,总体耗时更短、路径更优,能减少移动机器人本身的能耗,提高整体工作效率。  相似文献   

11.
针对移动机器人在导航定位过程中,使用传统蒙特卡罗定位算法会产生粒子收敛较慢和定位精度不高,以及发生人为绑架情况后重定位效率较低的问题,给出了一种改进的粒子滤波定位方法来提高移动机器人的导航定位效率.首先,在蒙特卡罗定位算法的基础上进行改进,融入自适应区域划分的方法,保证所划区域包含更多有效信息,减少粒子的收敛时间,完成机器人初步粗定位.然后,在粒子采样和重采样阶段,使用正态分布概率模型进行粒子权重更新,实现更加快速高效地全局精定位.通过实验对比分析,所给方法与基于蒙特卡罗定位算法相比较,耗时缩短了4s,且本文的自适应蒙特卡罗定位方法,能够将定位误差保持在6cm左右,从而验证了所给方法的有效性和稳定性.  相似文献   

12.
为了提高移动机器人在室内人机共融环境下的运动安全和交互性,提出了一种融合行人运动信息的室内移动机器人动 态避障方法,同时考虑任务约束和社会规则。 首先,利用 YOLO v3 算法和 Deep Sort 算法分别对室内环境中的行人进行实时检 测与目标跟踪,计算行人在过去时刻的历史轨迹。 然后,利用 Social-GAN 算法构建行人交互模型,实现轨迹预测。 在此基础上, 将行人的运动状态融合进机器人避障算法之中,根据社会规则设计评价函数,对机器人采样速度样本进行评估,使移动机器人 能够以安全和舒适的方式绕过行人,确保室内人机共融环境下移动机器人的社会接受性。 通过实验对比分析,与传统 DWA 方 法相比,本文方法不仅可以提高机器人导航避障效率,在相同室内场景下导航避障时间由 23. 56 s 提高到 19. 38 s,而且可以有 效降低与行人发生碰撞的风险,保证机器人导航的安全和社交性。  相似文献   

13.
针对由无人自动跟踪机器人构成的移动传感器网络中的目标跟踪问题,提出了一种基于感知代理和移动控制法则的分布式目标跟踪方案。首先,在构建移动机器人代理模型和覆盖感知目标跟踪模型的基础上,提出了一种分布式目标跟踪算法,算法由估计阶段和一致性阶段构成.通过这两个阶段的执行,网络中的全部代理就最大感知置信值以及相应的目标状态和后验协方差矩阵达成一致,从而提高各自预测的性能;其次,针对一般移动代理的移动提出了一种基于势场的控制法则,以确保传感器网络在任何时候都保持连接,使得每个移动代理尽可能接近目标,提高其感知置信值,并避免与目标、环境墙壁和其他代理发生碰撞,从而有助于保持该区域的覆盖率在令人满意的水平。仿真实验结果表明,跟踪方案不仅能够提高跟踪精度,而且还具有较好的覆盖感知性能。  相似文献   

14.
针对巡逻机器人的避障导航,基于Realsense深度摄像头获取环境深度信息,在使用机载计算机对深度图像进行分层处理的基础上,设计了巡逻机器人避障导航系统,同时对巡逻机器人通信协议以及决策流程等进行了改进设计,最后在ROS机器人开源操作系统上对其进行实验及验证。实验结果表明,在相同环境下,该方法能使巡逻机器人快速、安全、有效地避开静态障碍物而到达目标点。该方法不仅能够提高避障的成功率,获得实时避障效果,而且能够降低巡逻机器人的数据处理量,有利于巡逻机器人的移植。  相似文献   

15.
There are many challenges for robot navigation in densely populated dynamic environments. This paper presents a survey of the path planning methods for robot navigation in dense environments. Particularly, the path planning in the navigation framework of mobile robots is composed of global path planning and local path planning, with regard to the planning scope and the executability. Within this framework, the recent progress of the path planning methods is presented in the paper, while examining their strengths and weaknesses. Notably, the recent developed Velocity Obstacle method and its variants that serve as the local planner are analyzed comprehensively. Moreover, as a model-free method that is widely used in current robot applications, the reinforcement learning-based path planning algorithms are detailed in this paper.  相似文献   

16.
针对松鼠搜索算法(SSA)优化长短期记忆人工神经网络(LSTM)时,存在优化参数易陷入局部最优以及LSTM预测效率下降的问题,提出一种自适应变异混沌松鼠搜索算法(AMCSSA)优化LSTM学习率及其下降因子的预测模型。通过计算AMCSSA的时间复杂度证明其在未增加算法复杂度的前提下提高寻优效率,AMCSSA采用切比雪夫混沌映射生成混沌初始种群,并将捕食者概率改为非线性递减模式,利用位置贪婪选择策略使其在算法迭代过程中不断更新并保留更优个体,引入自适应T变异策略提高SSA在搜索空间中的勘探能力。通过AMCSSA对LSTM的学习率及其下降因子进行参数寻优,进一步提高LSTM的预测能力。对滚动轴承的剩余使用寿命(RUL)进行实验验证,结果表明所提方法相较于传统SSA、粒子群算法(PSO)、蝙蝠算法(BAT)以及萤火虫算法(FA)优化LSTM后,在预测中的精度分别提高了1.05%、7.61%、8.4%以及7.73%,并且使优化后的LSTM在完成收敛所需要的迭代次数减少,从而提高预测效率。  相似文献   

17.
在无基准图的无人机返航过程中,实时图和航路点的景象匹配是无人机返航成功的关键。为提高景象匹配的实时性和鲁棒性,提出了基于加速分割检测特征(FAST)角点检测和快速视网膜关键点(FREAK)描述符的无人机景象匹配算法。首先,针对FAST角点检测方法的无尺度不变性、特征点数量冗余的缺点进行了改进;接着,对FREAK二进制描述符进行简化,以提高匹配速度;然后,采用K近邻比值法和RANSAC方法进行特征的初匹配和精匹配,并建立定位模型,从而获得航路点与无人机当前位置的实际距离和方位信息;最后,对算法的各项性能做实验验证。所提出的算法定位方向偏差在1°以内,像面距离偏差稳定在0.6 pixel,运行时间0.43 s,远小于尺度不变特征转换(SIFT)和加速鲁棒特征(SURF)算法的处理时间。在尺度变换和噪声等条件变化的情况下,相比SIFT和SURF等算法,所提算法取得了较好的正确匹配率,具有更好的鲁棒性。实验结果表明所提出的算法鲁棒性好,运算速度快,尤其在视角变换方面表现优秀,更适合无人机视觉辅助导航。  相似文献   

18.
在基于相似日的短期电力负荷预测技术中,相似日的选取影响着负荷预测精度,提出一种基于灰色关联分析(grey relation analysis,GRA)和K均值(K-means)聚类选取相似日的短期负荷预测模型。首先,采用灰色关联分析方法选取相似日粗集,再对相似日粗集的外部因素使用K均值聚类。然后,计算待预测日与聚类中心的欧氏距离,将距离最小一类作为最终相似日集合。最后,利用最终相似日集合训练长短期记忆(long-short term memory, LSTM)神经网络,进行负荷预测。与未采用相似日的LSTM模型和采用传统的灰色关联分析的LSTM模型相比,所提方法的平均绝对百分比误差(mean absolute percentage error,MAPE)分别降低了0.911%、0.637%。算例分析表明,采用GRA-K-means选取相似日可以有效提升短期电力负荷的预测精度。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号