首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 109 毫秒
1.
基于LCS的多机器人路径规划控制体系结构   总被引:1,自引:0,他引:1  
提出了一种基于学习分类器的多机器人混合分层体系结构.体系协作规划层中的人工势场栅格法、协调规划层的学习分类器广播操作及行为控制层的多机器人DSP控制系统,易于实现多机器人间的通信联络及系统的扩充,提高了整个多机器人系统的实用性、实时性和可靠性.  相似文献   

2.
段勇  陈腾峰 《信息技术》2012,(6):100-103
采用强化学习解决多机器人避碰问题。然后针对表格式Q学习算法只能用于离散的状态并且学习时间过长,难以收敛的不足,提出了神经网络和Q学习相结合的算法。最后将该算法应用到多机器人避碰问题中,仿真实验表明该算法有效,能较好地解决多机器人避碰问题。  相似文献   

3.
分布式强化学习在RoboCup中的应用   总被引:1,自引:0,他引:1  
强化学习理论由于其自学习性和自适应性的优点而得到了广泛关注。基于主Agent的概念改进了传统的群体强化学习算法,应用于机器人足球(Robocup)仿真实验中,取得了初步结果。  相似文献   

4.
作为神经网络控制的基本单元,采用不同学习规则的神经元控制器,对神经元的学习过程将产生不同的影响。本文通过对神经元学习规则的探讨,提出了一种基于引导因子的神经元改进学习规则,并将其用于实际控制系统中。仿真结果表明,改进的方法对于加速神经元学习过程,提高控制器性能,具有较为显著的作用。  相似文献   

5.
针对存在随机运动障碍的复杂动态环境,提出了一种改进的机器人路径规划新方法。对于随机运动障碍,综合考虑机器人与障碍物的相对位置及相对速度,设计一种新的动态障碍避碰规则,使机器人安全地避开障碍,并避免大量迂回路径;对于匀变速运动目标,采用改进的人工势场法,引入相对速度及加速度因素,使机器人能追上目标并保持同步运动。基于Matlab的仿真实验验证了所提方法的有效性。  相似文献   

6.
白宁 《现代电子技术》2013,(24):22-24,28
针对支持向量机(svM)模型不能有效处理海量数据挖掘的问题,提出一种改进的基于主动学习的支持向量机(AL_SVM)方法。该方法首先将训练集随机划分为多个独立同分布的子集,并选择其中一个子集作为初始训练集来训练SVM得到初始分类器和支持向量集,然后根据已经得到的分类器信息在剩余样本集中选择对于分类器改进作用最大的有价值样本。并与已得到的支持向量集合并构成新训练集,以更新分类器,从而在保留重要支持向量信息的前提下,去除大量不重要的支持向量,一定程度上避免了过学习问题,提高了学习效率。实验表明,AL_SVM方法能够在保持学习器泛化能力的同时提高其学习效率。  相似文献   

7.
对基于模糊神经网络的人脸图像分类器进行研究。将多输入单输出模糊推理系统改造成多输入多输出的模糊神经分类器,并提出了一种改进的模糊神经分类器,改进模型的计算量明显减少。在将模糊规则库与训练样本集对应的基础上提出了一种模糊隶属函数参数的初始化方法。该初始化方法的优点在于它充分利用了训练样本所包含的鉴别信息。在ORL人脸的原始图像空间中用上述方法设计分类器,获得了较好的实验结果。  相似文献   

8.
改进的模糊神经网络及其在人脸识别中的应用   总被引:1,自引:0,他引:1  
对基于模糊神经网络的人脸图像分类器进行研究.将多输入单输出模糊推理系统改造成多输入多输出的模糊神经分类器,并提出了一种改进的模糊神经分类器,改进模型的计算量明显减少.在将模糊规则库与训练样本集对应的基础上提出了一种模糊隶属函数参数的初始化方法.该初始化方法的优点在于它充分利用了训练样本所包含的鉴别信息.在ORL人脸的原始图像空间中用上述方法设计分类器,获得了较好的实验结果.  相似文献   

9.
为增强机器人的认知情感计算能力,依据PAD情感空间建立结合即时反馈和长期趋势的机器人认知情感生成方法,该文提出一种基于强化学习的机器人认知情感交互模型.首先,依据人际交往心理学理论,模拟人类情感生成过程进行类人情感生成,并从中提取相似性、积极性、共情性3个影响因素;其次,利用强化学习的全局统筹特性,建立响应情感状态与上下文长期情感状态之间的关联关系,从而对机器人情感生成过程进行建模;然后,将3个因素纳入模型奖励机制用于交互情感状态评估,实现模型更新并得到最优情感策略;最后,利用所得最优情感策略对应的最优情感状态对机器人情感状态转移概率进行更新,并依据6种基本情感状态在空间中的情感值,将其映射到连续情感空间中得到机器人的最优响应情感值.主客观对比实验表明,该文模型能有效增加机器人情感表达的细腻性、连续性、积极性以及共情性,还能有效降低机器人对外界情感刺激的依赖性,进一步提升和谐友好的人机交互关系.  相似文献   

10.
对基于模糊神经网络的人脸图像分类器进行研究。将多输入单输出模糊推理系统改造成多输入多输出的模糊神经分类器,并提出了一种改进的模糊神经分类器,改进模型的计算量明显减少。在将模糊规则库与训练样本集对应的基础上提出了一种模糊隶属函数参数的初始化方法。该初始化方法的优点在于它充分利用了训练样本所包含的鉴别信息。在ORL人脸的原始图像空间中用上述方法设计分类器,获得了较好的实验结果。  相似文献   

11.
To enable a relevance feedback paradigm to evolve itself by users’ feedback, a reinforcement learning method is proposed. The feature space of the medical images is partitioned into positive and negative hypercubes by the system. Each hypercube constitutes an individual in a genetic algorithm infrastructure. The rules take recombination and mutation operators to make new rules for better exploring the feature space. The effectiveness of the rules is checked by a scoring method by which the ineffective rules will be omitted gradually and the effective ones survive. Our experiments on a set of 10,004 images from the IRMA database show that the proposed approach can better describe the semantic content of images for image retrieval with respect to other existing approaches in the literature.  相似文献   

12.
李霞  罗萍  罗雪晖  张基宏 《信号处理》2002,18(5):434-437
本文提出一种用于图像压缩编码的模糊增强学习码书设计算法。该算法是在模糊竞争学习矢量量化的基础上引入增强学习,并用输入训练模式的监督信号与类别模式之间的隶属度控制增强信号。实验结果表明,该算法对初始码本依赖性小,与模糊竞争学习矢量量化和微分竞争学习算法相比,收敛速度更快,性能更好。  相似文献   

13.
仵博  郑红燕  冯延蓬  陈鑫 《电子学报》2014,42(7):1429-1434
针对贝叶斯强化学习中参数个数巨大,收敛速度慢,无法实现在线学习的问题,提出一种基于模型的可分解贝叶斯强化学习方法.首先,将学习参数进行可分解表示,降低学习参数的个数;然后,根据先验知识和观察数据采用贝叶斯方法来学习,最优化探索和利用二者之间的平衡关系;最后,采用基于点的贝叶斯强化学习方法实现学习过程的快速收敛,从而达到在线学习的目的.仿真结果表明该算法能够满足实时系统性能的要求.  相似文献   

14.
基于高斯过程分类器的连续空间强化学习   总被引:2,自引:1,他引:1       下载免费PDF全文
王雪松  张依阳  程玉虎 《电子学报》2009,37(6):1153-1158
如何将强化学习方法推广到大规模或连续空间,是决定强化学习方法能否得到广泛应用的关键.不同于已有的值函数逼近法,把强化学习构建为一个简单的二分类问题,利用分类算法来得到强化学习中的策略,提出一种基于高斯过程分类器的连续状态和连续动作空间强化学习方法.首先将连续动作空间离散化为确定数目的离散动作,然后利用高斯分类器对系统的连续状态-离散动作对进行正负分类,对判定为正类的离散动作按其概率值进行加权求和,进而得到实际作用于系统的连续动作.小船靠岸问题的仿真结果表明所提方法能够有效解决强化学习的连续空间表示问题.  相似文献   

15.
This paper surveys recent multiagent reinforcement learning and neural Myerson auction deep learning efforts to improve mobility control and resource management in autonomous ground and aerial vehicles. The multiagent reinforcement learning communication network (CommNet) was introduced to enable multiple agents to perform actions in a distributed manner to achieve shared goals by training all agents' states and actions in a single neural network. Additionally, the Myerson auction method guarantees trustworthiness among multiple agents to optimize rewards in highly dynamic systems. Our findings suggest that the integration of MARL CommNet and Myerson techniques is very much needed for improved efficiency and trustworthiness.  相似文献   

16.
ART2网络的学习速率调整及其影响   总被引:1,自引:0,他引:1  
首先讨论了ART2网络的常用学习规则,指出快速学习方式中隐式蕴含了在其他神经网络中常提到的学习速率,并给出了调整这种隐式学习速率的方法.通过实例说明了学习速率调整对模式漂移现象的抑制作用,并对比了不同学习速率对Iris数据集分类的影响.  相似文献   

17.
控制系统的响应特性取决于控制律参数,经典的PID方法难以实现参数的自整定。强化学习能够通过系统自身和环境的交互实现参数的自动调整,但是在控制律参数需要频繁调整的应用场合,常规的强化学习方法无法满足实时性要求,而且容易陷入局部收敛。对传统的强化学习方法加以改进后,加快了在线学习速度,提高了强化学习算法的寻优能力。仿真结果表明,该方法可以在一定范围内快速求得全局最优解,提高控制系统的自适应性,为控制系统参数的自整定提供了依据。  相似文献   

18.
针对深度神经网络模型仅学习当前指代链语义信息忽略了单个指代链识别结果的长期影响问题,提出一种结合深度强化学习(deep reinforcement learning)的维吾尔语人称代词指代消解方法.该方法将指代消解任务定义为强化学习环境下顺序决策过程,有效利用之前状态中先行语信息判定当前指代链指代关系.同时,采用基于整体奖励信号优化策略,相比于使用损失函数启发式优化特定的单个决策,该方法直接优化整体评估指标更加高效.最后在维吾尔语数据集进行实验,实验结果显示,该方法在维吾尔语人称代词指代消解任务中的F值为85.80%.实验结果表明,深度强化学习模型能显著提升维吾尔语人称代词指代消解性能.  相似文献   

19.
一种新颖的多agent强化学习方法   总被引:2,自引:1,他引:2       下载免费PDF全文
周浦城  洪炳殚  黄庆成 《电子学报》2006,34(8):1488-1491
提出了一种综合了模块化结构、利益分配学习以及对手建模技术的多agent强化学习方法,利用模块化学习结构来克服状态空间的维数灾问题,将Q-学习与利益分配学习相结合以加快学习速度,采用基于观察的对手建模来预测其他agent的动作分布.追捕问题的仿真结果验证了所提方法的有效性.  相似文献   

20.
强化学习通过与环境的交互学得任务的决策策略,具有自学习与在线学习的特点。但交互试错的机制也往往导致了算法的运行效率较低、收敛速度较慢。知识包含了人类经验和对事物的认知规律,利用知识引导智能体(agent)的学习,是解决上述问题的一种有效方法。该文尝试将定性规则知识引入到强化学习中,通过云推理模型对定性规则进行表示,将其作为探索策略引导智能体的动作选择,以减少智能体在状态-动作空间探索的盲目性。该文选用OpenAI Gym作为测试环境,通过在自定义的CartPole-v2中的实验,验证了提出的基于云推理模型探索策略的有效性,可以提高强化学习的学习效率,加快收敛速度。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号