排序方式: 共有2条查询结果,搜索用时 78 毫秒
1
1.
探测概率、虚警概率和作用距离是衡量红外探测系统最核心的性能指标。传统的分析方法只针对单个红外探测系统,随着多个红外系统协同探测的应用不断增多,迫切需要建立红外系统协同探测的性能分析方法。本文从单个红外探测系统出发,结合经典探测概率、虚警概率和作用距离的计算公式,基于二次累积探测原理分析协同探测时各性能指标提升的根本原因,并通过两个红外系统协同探测的示例直观展示了协同探测的性能提升效果,为红外探测系统的综合论证、协同样式分析等提供了重要依据。 相似文献
2.
针对传统深度强化学习算法难以快速解决长时序复杂任务的问题,提出了一种引入历史信息和人类知识的深度强化学习方法,对经典近端策略优化(Proximal Policy Optimization, PPO)强化学习算法进行改进,在状态空间引入历史状态以反映环境的时序变化特征,在策略模型中基于人类认知增加无效动作掩膜,禁止智能体进行无效探索,提高探索效率,从而提升模型的训练性能。仿真结果表明,所提方法能够有效解决长时序复杂任务的智能决策问题,相比传统的深度强化学习算法可显著提高模型收敛效果。 相似文献
1