共查询到19条相似文献,搜索用时 46 毫秒
1.
2.
针对大气层内高速机动目标的拦截问题,提出了一种基于双延迟深度确定性策略梯度(TD3)算法的深度强化学习制导律,它直接将交战状态信息映射为拦截弹的指令加速度,是一种端到端、无模型的制导策略。首先,将攻防双方的交战运动学模型描述为适用于深度强化学习算法的马尔科夫决策过程,之后通过合理地设计算法训练所需的交战场景、动作空间、状态空间和网络结构,并引入奖励函数整形和状态随机初始化,构建了完整的深度强化学习制导算法。仿真结果表明:与比例导引和增强比例导引两种方案相比,深度强化学习制导策略在脱靶量更小的同时能够降低对中制导精度的要求;具有良好的鲁棒性和泛化能力,并且计算负担较小,具备在弹载计算机上运行的条件。 相似文献
3.
针对空间非合作目标清除任务中的目标适应性以及俘获动作规划复杂性等问题,提出了一种基于强化学习方法并结合“多臂分组协同”机制的包络俘获策略。首先构建了多臂俘获机构的物理模型和运动学模型,之后利用SAC(soft actor-critic)算法并引入前演训练(PT)设计了强化学习控制器,接着基于“多臂分组协同”奖励机制设计奖励函数以训练得到最优俘获动作。为了验证俘获策略对单目标作业的高效性和对多目标作业的高适应性,对各种目标分别进行仿真实验。仿真结果表明:所得的俘获策略可以对多种构型的目标实现高效、高适应地俘获。 相似文献
4.
基于轨道机动的高轨目标自主感知技术 总被引:1,自引:0,他引:1
轨道机动可为高轨目标在轨感知提供有利的成像条件,文章在高轨目标感知需求分析的基础上,主要从目标构型识别的角度介绍高轨目标精准感知技术.结合高轨目标的轨道特性和光照特性,在顺光观测的约束条件下,介绍了高轨目标的掠飞和绕飞成像轨道控制方法;针对威胁目标在轨感知,基于目标轨道特性给出了感知相机精准配置方法;针对目标构型精细感... 相似文献
5.
针对欧空局SpotGEO竞赛中地球同步轨道目标物的检测问题,提出面向低精度CCD空间图像的深度学习检测方法。在图像预处理环节,分别采用高斯过程回归和模板匹配实现前景/背景分割和多帧图像配准。根据地球同步轨道物体的运动特征,采用拓扑扫描提取候选目标物。在此基础上,提出一套基于深度学习的目标物筛选方法。该方法利用卷积神经网络,依次对拓扑扫描前后候选目标物进行筛选,显著减少噪声点数量,提高检测效率。仿真结果表明,该方法达到98%的目标检测准确率,适用于存在光污染、云层遮挡等干扰的复杂环境。 相似文献
6.
针对高速机动飞行器常用的程序化机动突防方式适应性不强、突防效果不稳定的问题,提出了一种基于深度强化学习算法的机动博弈制导方法。该方法以增大交会摆脱量为任务目标,采用深度神经网络拟合飞行器的制导律,应用强化学习方法训练网络参数,得到一种以突防拦截双方的位置和速度为输入、以飞行器的需用过载为输出的智能机动博弈制导律。数学仿真验证结果表明,在连续的状态空间和动作空间中,飞行器能根据当前态势自主选择合适的制导指令。相比传统突防方式,该制导律显著提升了交会摆脱量,且突防效果更稳定。 相似文献
7.
为了保证精确打击机动目标,导弹可以采用主/被动雷达切换探测目标。考虑到作战的隐蔽性和生存性,提出基于多传感器信息融合的被动优先跟踪方法:跟踪开始时,令主/被动雷达同时对目标进行探测和跟踪,将二者的信息进行融合,同时自适应地学习融合结果与二者信息的偏差,经过一段时间学习,融合偏差稳定,此时令主动雷达停止工作,由被动雷达单独工作,而目标的运动信息则由被动雷达的信息和学习得到的融合偏差合成。如果目标机动较大,则定期令主动雷达工作以进一步修正融合偏差。该方法既保证了跟踪的精度,同时又减少了主动雷达的工作时间,从而提高了作战的隐蔽性和生存性。将该方法应用于导弹的目标跟踪,仿真结果表明该方法有效。 相似文献
9.
针对航天器轨道追逃博弈问题,提出一种多阶段学习训练赋能方法,使得追踪星在终端时刻抵近逃逸星的特定区域,而逃逸星需要通过轨道机动规避追踪星。首先,构建两星的训练策略集,基于逻辑规则设计追踪星和逃逸星的机动策略,通过实时预测对方的终端位置,设计己方的期望位置和脉冲策略,显式给出追逃策略的解析表达式,用于训练赋能;其次,为提升航天器的训练赋能效率及应对未知环境的博弈能力,提出一种基于强化学习技术多模式、分阶段的学习训练方法,先使追踪星和逃逸星分别应对上述逻辑规则引导下的逃逸星和追踪星,完成预训练;再次,开展二次训练,两星都采用邻近策略优化(PPO)策略进行追逃博弈,在博弈中不断调整网络权值,提升决策能力;最后,在仿真环境中验证提出的训练方法的有效性,经过二次训练后,追踪星和逃逸星可有效应对不同策略驱动下的对手,提升追逃成功率。 相似文献
10.
针对交互多模型(IMM)算法求解地球静止轨道(GEO)卫星混合推力机动目标跟踪问题时模型匹配难、模型转移概率近似平均和响应速度慢的问题,从交互模型集构建和模型转移概率自适应设计两个方面出发提出一种改进IMM算法。该方法通过考虑无机动、脉冲机动和有限推力机动三种模式,构建了覆盖目标机动状态的交互模型集,提高了模型与机动目标实际运行状态的匹配度;采用一种基于加速度估计自适应修正的模型交互概率修正方法,提升了算法对目标机动状态的响应速度和跟踪精度。仿真结果表明,所提算法是解决混合推力模式下的GEO机动目标跟踪问题的有效手段,在收敛速度和收敛精度等方面与传统方法相比有较大提高。 相似文献
11.
12.
13.
14.
15.
16.
针对行星表面轻量化自主探测任务,基于仿生思想设计了一种仿海胆结构的十二足球形机器人,其具备自主改变构型以贴合复杂地形的能力,可实现无倾覆、高容错的全向运动;基于数据驱动方法,对该机器人设计了一种数据高效的无模型强化学习运动策略,可实现无先验知识的从0到1步态训练以及步态的实物样机快速部署。通过在平面地形和非结构化地形中对其进行仿真实验,验证了经过训练的机器人具备自主运动、适应非结构地形等能力;通过与常用基准策略进行对比,证实了本文提出的运动策略具有训练高效、鲁棒性好的优势;最后通过开发原理样机,开展实物实验验证了仿真环境中所生成的步态在真实物理环境中的动力学可行性。 相似文献
17.
将再励学习引入模糊神经网络的T-S模型,建立了模糊神经网络控制器和控制评估网络的再励学习算法,并应用于三轴稳定卫星的姿态控制。这种再励模糊神经网络不需要精确的卫星数学模型和学习样本,通过再励学习实现控制网络/评估网络参数的在线调节,具有比较强的适应性和学习能力。仿真结果表明,这种智能控制方法可以有效解决卫星的模型不确定性问题,提高了卫星姿态控制的精度和鲁棒性。 相似文献