排序方式: 共有38条查询结果,搜索用时 0 毫秒
1.
针对稀疏奖励下,复杂任务学习效率低的问题,在离线策略(off-policy)强化学习思想基础上,提出了元生成内在奖励算法(meta generative intrinsic reward, MGIR),并将其应用在机器人操作技能学习问题求解方面。具体步骤为先使用一个可将复杂任务分解为多个子任务的元生成内在奖励框架,对子任务进行能力评价;再引入生成内在奖励模块,将智能体探索得到状态的新颖性作为内在奖励,并联合环境奖励共同指导智能体完成对环境的探索和特定任务的学习;最后,在MuJoCo仿真环境Fetch中对离线策略强化学习进行对比实验。实验结果表明,无论是在训练效率还是在成功率方面,提出的元生成内在奖励算法均表现较好。 相似文献
2.
提出一种用于行人目标检测的视觉注意模型化计算方法。在提取行人目标显著表象特征的基础上,通过多尺度分解后,各尺度图像之间的差减与归一化运算构成显著图;同时,根据肤色高斯似然计算模型,提取行人目标特有的皮肤颜色特征图,再通过分块图像中分类像素点累计计数与阈值化均值滤波相结合的方法精化肤色提取结果以构成导引图;进而提出一种将显著图与导引图通过有偏置的加权整合策略实现目标区域的准确预测。通过Penn-Fudan行人数据库和实拍视频的实验结果表明,所提方法的检测准确率优于现有其他计算模型,且相对传统目标检测算法,能够大幅度减少时间开销,提高检测效率。 相似文献
3.
提出了一种基于功用性图的目标推抓技能自监督学习方法。首先,给出了杂乱环境下面向目标推抓任务的机器人技能自监督学习问题描述,将工作空间中机器人推抓操作的决策过程定义为一个全新的马尔可夫决策过程(MDP),分别训练视觉机制模块与动作机制模块。其次,在视觉机制模块中融合自适应参数与分组拆分注意力模块设计了特征提取网络RGSA-Net,可由输入网络的原始状态图像生成功用性图,为目标推抓操作提供良好的前提。然后,在动作机制模块中搭建了基于演员-评论家(actor-critic)框架的深度强化学习自监督训练框架DQAC,机器人根据功用性图执行动作后利用该框架进行动作评判,更好地实现了推、抓之间的协同。最后,进行了实验对比与分析,验证了本文方法的有效性。 相似文献
4.
5.
由于相干光正交频分复用(CO-OFDM)系统很高的峰均功率比(PAPR)以及非常近的子载波间隔,使得链路色散导致的子载波走离对光纤非线性损伤的影响更加明显。研究了不同色散分布、不同残余色散情况下,无色散补偿光纤(DCF)和有色散补偿光纤的光纤链路时CO-OFDM系统的非线性损伤以及系统性能。针对单信道40 Gb/s CO-OFDM系统,无DCF链路比完全补偿DCF链路,Q因子高5.1 dB;对于DCF链路,当残余色散从0变为到1200ps/nm时,最大Q因子提高了4dB,非线性阈值提高了4 dBm,1200ps/nm时性能几乎和无色散补偿系统相同。 相似文献
6.
针对物联网系统复杂应用环境中由关键节点失效导致的系统拓扑结构的脆弱性问题,提出了一种抗毁性k-连通拓扑结构的构建方法.首先把系统分成若干个互不交叠的簇,然后对网络中存在的关键节点进行检测,并利用簇头节点的移动性构建以关键节点为中心的局部k-连通拓扑结构,达到去除关键节点和提高网络抗毁性的目的.构建了簇间的k-连通拓扑结构,给出了物联网智能安防系统应用仿真实验,并通过节点的介数中心性、网络的平均连通度和网络的鲁棒性验证了所提抗毁性方案的可行性和有效性. 相似文献
7.
为研究量子点发光器件结构与性能的关系,制备了以CdSe/ZnS量子点作为发光层、poly-TPD作为空穴传输层,Alq3作为电子传输层的量子点发光二极管,对器件结构及性能参数进行了表征,结果显示器件具有开启电压低、色纯度高等特点.结合测试数据,对量子点发光二极管进行了器件结构建模,利用隧穿模型及空间电荷限制电流模型对实验结果进行了分析,研究了器件中载流子的注入与传输机理.器件测试与仿真结果表明:各功能层厚度会影响载流子在量子点层的注入平衡,同时器件中载流子的注入与传输存在一转变电压,当外加电压低于转变电压时,器件中载流子的注入主要符合隧穿模型;当外加电压高于转变电压时,器件中载流子的注入主要符合空间电荷限制电流模型.研究结果验证了器件结构建模的合理性,可以利用仿真的方法进行器件结构优化并确定相关参数,这对器件性能的提高具有指导意义. 相似文献
8.
9.
理论和实践研究表明贝尔实验室垂直分层空时码(V-BLAST)可显著提高多天线系统的传输容量.传统的V-BLAST译码算法是排序连续干扰抵消算法(OSIC),然而由于数据层间误码传播的影响,OSIC并不能有效地提高整个系统的分集增益.利用最近提出的迭代V-BLAST译码算法,低分集增益数据层通过高分集增益数据层的判决反馈来迭代检测,整个系统的性能得到提高.但这种算法的迭代次数高,迭代的次数与MIMO系统中发射天线的数量相等.为了减少系统实现的复杂性,提出了一种新的迭代的V-BLAST译码算法.仿真结果证明在对称系统中(接收天线和发射天线数相等),新算法与传统V-BLAST译码算法相比性能有了很大提高. 相似文献
10.
触觉传感器(柔性电子皮肤)在机器人进行人机交互和工具操作时发挥着重要作用,如何有效利用触觉信息进行物体检测是当前研究的主要瓶颈.鉴于此,提出一种脉冲图残差卷积神经网络SNN-Atten-ResGCN的物体检测算法.首先使用图残差网络ResGCN模型训练触觉时间序列的表征信息,通过引入深度学习模型中的注意力机制拟合触觉数据图形结构的局部特征;然后对重构的触觉图形输入由3个LIF神经元和2个FC全连接层组成的SNN脉冲神经网络训练得到特征向量;最后投票层Vote解码网络特征并检测物体类别.在EvTouch-Objects和EvTouch-Containers两个家庭常见物体触觉数据集上进行对比实验,实验结果表明,所提出方法在保证模型迭代效率的同时,对各种不同的家庭工具对象和容器对象的检测准确率、精度、召回率和$F_1$-score均有提升. 相似文献