排序方式: 共有6条查询结果,搜索用时 15 毫秒
1
1.
2.
针对深度强化学习在高维机器人行为控制中训练效率低下和策略不可解释等问题,提出一种基于结构交互驱动的机器人深度强化学习方法(structure-motivated interactive deep reinforcement learning, SMILE).首先,利用结构分解方法将高维的单机器人控制问题转化为低维的多关节控制器协同学习问题,从而缓解连续运动控制的维度灾难难题;其次,通过两种协同图模型(ATTENTION和PODT)动态推理控制器之间的关联关系,实现机器人内部关节的信息交互和协同学习;最后,为了平衡ATTENTION和PODT协同图模型的计算复杂度和信息冗余度,进一步提出两种协同图模型更新方法 APDODT和PATTENTION,实现控制器之间长期关联关系和短期关联关系的动态自适应调整.实验结果表明,基于结构驱动的机器人强化学习方法能显著提升机器人控制策略学习效率.此外,基于协同图模型的关系推理及协同机制,可为最终学习策略提供更为直观和有效的解释. 相似文献
3.
在开放世界中求解智能规划问题往往是比较困难的,这是由于在开放世界中,某些对象可能是未知的,因而在搜索规划解时需要考虑不同的可能性。一种解决的方法是使用传感器观察未知的对象,而该方法使用的前提是传感器能够保证获取规划所需的所有信息。与以往工作不同的是,本文考虑利用外部人士(Crowd)求解规划问题。假设存在一些外部人士可以为开放世界中某个规划问题提供必要的信息,然而在实际情况下,某些外部人士提供的信息可能是具有欺骗性的,如何使用此类信息求解规划问题是本文关注的重点。针对此类问题,本文提出了一个新颖的求解方法,首先获取一个求解开放世界下的规划问题所需的带有变量的命题公式集合,然后根据外部人士对命题公式的标注估计出变量所取的值,从而将开放世界中的规划问题转化为一般的规划问题求解。最后通过实验验证了该算法的有效性。 相似文献
4.
5.
Role mining and setup affect the usage of role-based access control (RBAC). Traditionally, user’s role and permission assigning
are manipulated by security administrator of system. However, the cost is expensive and the operating process is complex.
A new role analyzing method was proposed by generating mappings and using them to provide recommendation for systems. The
relation among sets of permissions, roles and users was explored by generating mappings, and the relation between sets of
users and attributes was analyzed by means of the concept lattice model, generating a critical mapping between the attribute
and permission sets, and making the meaning of the role natural and operational. Thus, a role is determined by permission
set and user’s attributes. The generated mappings were used to automatically assign permissions and roles to new users. Experimental
results show that the proposed algorithm is effective and efficient. 相似文献
6.
为了辅助xDSL Modem开发人员做好固件程序的测试工作,提出了一个通用的二进制数据流翻译方案。它能够根据某个协议标准将Modem产生的二进制数据流转换成人们容易理解的形式,从而帮助开发人员快速判定Modem中的固件程序是否符合那个协议标准。同时,为了保证翻译程序不受协议版本变动的影响,将协议标准的内容以协议规则的形式存于外部文件。不同于现有的描述方式,提出了一个灵活且完备的协议规则描述方式,指出了协议规则应具备的10个属性。最后,实现了一个原型系统,并以国际通信联盟标准事业部的G.994.1协议标准为例验证了该翻译方案的有效性。 相似文献
1