排序方式: 共有99条查询结果,搜索用时 0 毫秒
1.
2.
3.
基于隐偏向信息学习的强化学习算法 总被引:4,自引:0,他引:4
传统的强化学习算法应用到大状态、动作空间和任务复杂的马尔可夫决策过程问题时,存在收敛速度慢,训练时间长等问题.有效地学习和利用问题中包含的偏向信息可以加快学习速度,提高学习效率.在分析了偏向机制特点的基础上引入了隐偏向信息的概念,建立了一种基于偏向信息学习的强化学习模型,并提出了一种基于特征的改进SARSA(λ)算法.针对于拄箱任务的实验表明,改进的算法明显提高了学习效率. 相似文献
4.
简要分析烟草物流中心在信息系统方面的需求,基于衡阳烟草物流中心业务流程,介绍TIMMS系统的部署、模块、功能模型等,较清晰地分析并讨论了TIMMS系统架构,对于行业内TIMMS系统的实施及改进具有较实用的参考价值。 相似文献
5.
6.
针对当前山东煤矿通风系统存在的突出问题 ,从矿井通风网路的形式、通风能力、主扇运转、抗灾能力等方面 ,提出了衡量矿井通风系统安全可靠性的定性和定量指标。 相似文献
7.
我国肥料施用体系的现状及其发展 总被引:1,自引:0,他引:1
科学的施肥体系应具有高效合理的规划、生产、供应及施肥技术规范,本文分析了我国肥料产、销、用的现状,提出建设科学施肥体系的构思。 相似文献
8.
9.
10.