共查询到10条相似文献,搜索用时 15 毫秒
1.
在深度强化学习领域,如何有效地探索环境是一个难题。深度Q网络(Deep Q-Network,DQN)使用ε-贪婪策略来探索环境,ε的大小和衰减需要人工进行调节,而调节不当会导致性能变差。这种探索策略不够高效,不能有效解决深度探索问题。针对DQN的ε-贪婪策略探索效率不够高的问题,提出一种基于平均神经网络参数的DQN算法(Averaged Parameters DQN,AP-DQN)。该算法在回合开始时,将智能体之前学习到的多个在线值网络参数进行平均,得到一个扰动神经网络参数,然后通过扰动神经网络进行动作选择,从而提高智能体的探索效率。实验结果表明,AP-DQN算法在面对深度探索问题时的探索效率优于DQN,在5个Atari游戏环境中相比DQN获得了更高的平均每回合奖励,归一化后的得分相比DQN最多提升了112.50%,最少提升了19.07%。 相似文献
2.
针对现有方法难以准确地估算山体滑坡体积的问题,引入人工智能算法,提出耦合迁移学习与微分算法的低空摄影测量山体滑坡方量估算方法。首先,利用SfM与SGM密集匹配等算法从低空无人机立体影像中解算出高精度三维密集点云,结合可见光植被指数和双边滤波算法从密集点云中剥离出目标区地面点云;然后,构建深度神经网络插值模型来表征二维坐标与高程之间的非线性映射关系,并基于参数共享的迁移学习来自适应优化深度神经网络以实现滑坡目标区高程值预测,进而重构滑坡区域的数字地表模型;最后,基于目标区滑坡前后数字地表模型高程差值和微分算法实现山体滑坡方量估算。实验结果表明,该方法平均相对误差为2.7%,相比常用的方法,显著提高了滑坡方量估计精度,并能适应不同地形条件下滑坡方量估算。 相似文献
3.
在信道译码结合深度学习技术的研究中,维数限制问题一直是研究者们寻求突破的重点。由于深度神经网络是储存密集型,深度神经网络信道解码器通常需要比传统置信传播(BP)译码大得多的计算和内存开销。为了缓解这个问题,提出了一种应用于LDPC码的改进的神经网络译码器。根据深度神经网络信道解码器中权重参数值分布,有选择性地对新的神经网络解码器添加权重参数,通过限制训练参数数量,降低了深度神经网络信道解码器的规模,并且算法与BP译码相比取得了较大译码增益。 相似文献
4.
深度神经网络是一种非常有效的机器学习方法,然而传统的算法均无法处理动态问题.因此,介绍了一种最近提出的能够动态学习的深度神经网络永续学习机算法.该算法能够实现对新增数据的动态学习,并且算法执行速度较快.通过对文献的分析表明,该算法是一种拥有非常广泛应用价值的深度学习算法. 相似文献
5.
深度神经网络过深的网络架构和冗余的参数会导致昂贵的计算成本,近年来深度神经网络的压缩与加速已成为研究热点。针对现有方法的范数准则局限性以及标签依赖问题,提出一种基于聚类中心和生成对抗学习的结构化滤波器剪枝方法(FPCC-GAN):使用K-means聚类算法按卷积层将滤波器逐层聚类;比例化修剪各簇内离聚类中心较近的提取冗余特征的滤波器;使用生成对抗学习迭代训练。实验结果分析表明,与当前主流方法相比,该方法具有更高的准确率。 相似文献
6.
由于传统车间调度方法实时响应能力有限,难以在复杂调度环境中取得良好效果,提出一种基于深度Q网络的深度强化学习算法。该方法结合了深度神经网络的学习能力与强化学习的决策能力,将车间调度问题视作序列决策问题,用深度神经网络拟合价值函数,将调度状态表示为矩阵形式进行输入,使用多个调度规则作为动作空间,并设置基于机器利用率的奖励函数,不断与环境交互,获得每个决策点的最佳调度规则。通过与智能优化算法、调度规则在标准问题集上的测试对比证明了算法有效性。 相似文献
7.
8.
PTA工业生产过程中4-CBA的含量是评价其产品质量的重要依据。将深度置信网络和已有的浅层算法相结合,提出基于深度置信网络的4-CBA软测量模型。深度置信网络是一种典型的深度学习算法,该算法在特征学习方面优势显著。根据实验结果,基于深度置信网络的软测量模型能够很好地估计4-CBA含量,和单纯的BP神经网络模型相比,基于深度置信网络的模型预测精度更高。 相似文献
9.
为了实现对电力工程造价高效、精确的估算,提出了一种电力工程造价的随机权深度神经学习估算算法(Random Weighted Deep Neural Learning,RWDNL)。通过构建外权随机的带有小中间层的多隐层神经网络模型,利用神经网络深度学习实现了对海量数据有效特征的提取以及电力工程项目造价估算。数值仿真实验结果表明该方法使工程造价估算精度和速度大大提高,可获得令人满意的泛化能力。 相似文献
10.
现有永磁同步电机普遍存在算法复杂、电机参数辨识困难、电磁转矩难以通过数学模型来精
确估算等问题,从而导致电机控制精度以及驱动系统的整体性能下降。该研究设计了一种基于动态递
归反馈型神经网络的电机电磁转矩网络拓扑模型,使用 MATLAB/Simulink 将该神经网络封装成转矩观
测器,并用于电机转矩的精确估算。实验结果显示,与传统转矩和反向传播神经网络计算方式相比,
该研究所设计的转矩观测器具有更高的转矩计算精度,与反向传播神经网络算法相比具有更高的控制
精度与准确性。 相似文献