期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

齐映红曹喜滨林健《航天控制》2008,26(5)

利用最优多脉冲方法,对目标航天器逼近过程的远程导引段轨道进行设计.基于Lawden主矢量理论,解决固定时间、燃料最省的逼近轨道问题.通过仿真分析了固定初始条件时燃料消耗量随着转移时间的变化关系.对于燃料和时间均有约束的情况,给出了求解燃料最省和时间最小的多目标优化问题的方法.这一研究对于评估具体任务的燃料消耗和转移时间有重要意义. 相似文献

2.

拦截大气层内机动目标的深度强化学习制导律

下载免费PDF全文

邱潇颀高长生荆武兴《宇航学报》2022,43(5):685-695

针对大气层内高速机动目标的拦截问题，提出了一种基于双延迟深度确定性策略梯度(TD3)算法的深度强化学习制导律，它直接将交战状态信息映射为拦截弹的指令加速度，是一种端到端、无模型的制导策略。首先，将攻防双方的交战运动学模型描述为适用于深度强化学习算法的马尔科夫决策过程，之后通过合理地设计算法训练所需的交战场景、动作空间、状态空间和网络结构，并引入奖励函数整形和状态随机初始化，构建了完整的深度强化学习制导算法。仿真结果表明：与比例导引和增强比例导引两种方案相比，深度强化学习制导策略在脱靶量更小的同时能够降低对中制导精度的要求；具有良好的鲁棒性和泛化能力，并且计算负担较小,具备在弹载计算机上运行的条件。相似文献

3.

一种面向空间非合作目标的强化学习多臂协同俘获策略研究

张柄汉王琛彭兆涛张夷斋张帆《宇航学报》2023,(12):1934-1943

针对空间非合作目标清除任务中的目标适应性以及俘获动作规划复杂性等问题,提出了一种基于强化学习方法并结合“多臂分组协同”机制的包络俘获策略。首先构建了多臂俘获机构的物理模型和运动学模型,之后利用SAC(soft actor-critic)算法并引入前演训练（PT）设计了强化学习控制器,接着基于“多臂分组协同”奖励机制设计奖励函数以训练得到最优俘获动作。为了验证俘获策略对单目标作业的高效性和对多目标作业的高适应性,对各种目标分别进行仿真实验。仿真结果表明：所得的俘获策略可以对多种构型的目标实现高效、高适应地俘获。相似文献

4.

基于轨道机动的高轨目标自主感知技术 总被引：1，自引：0，他引：1

肖余之陈记争《航天返回与遥感》2021,42(1):1-10

轨道机动可为高轨目标在轨感知提供有利的成像条件,文章在高轨目标感知需求分析的基础上,主要从目标构型识别的角度介绍高轨目标精准感知技术.结合高轨目标的轨道特性和光照特性,在顺光观测的约束条件下,介绍了高轨目标的掠飞和绕飞成像轨道控制方法;针对威胁目标在轨感知,基于目标轨道特性给出了感知相机精准配置方法;针对目标构型精细感... 相似文献

5.

地球同步轨道目标物深度学习检测方法

黄西尧何羿霆杜华军曾祥远刘天赐单文婧程林《宇航学报》2021,42(10):1283-1292

针对欧空局SpotGEO竞赛中地球同步轨道目标物的检测问题,提出面向低精度CCD空间图像的深度学习检测方法。在图像预处理环节,分别采用高斯过程回归和模板匹配实现前景/背景分割和多帧图像配准。根据地球同步轨道物体的运动特征,采用拓扑扫描提取候选目标物。在此基础上,提出一套基于深度学习的目标物筛选方法。该方法利用卷积神经网络,依次对拓扑扫描前后候选目标物进行筛选,显著减少噪声点数量,提高检测效率。仿真结果表明,该方法达到98%的目标检测准确率,适用于存在光污染、云层遮挡等干扰的复杂环境。相似文献

6.

一种基于深度强化学习的机动博弈制导律设计方法

朱雅萌张海瑞周国峰梁卓吕瑞《航天控制》2022,(3):28-36

针对高速机动飞行器常用的程序化机动突防方式适应性不强、突防效果不稳定的问题,提出了一种基于深度强化学习算法的机动博弈制导方法。该方法以增大交会摆脱量为任务目标,采用深度神经网络拟合飞行器的制导律,应用强化学习方法训练网络参数,得到一种以突防拦截双方的位置和速度为输入、以飞行器的需用过载为输出的智能机动博弈制导律。数学仿真验证结果表明,在连续的状态空间和动作空间中,飞行器能根据当前态势自主选择合适的制导指令。相比传统突防方式,该制导律显著提升了交会摆脱量,且突防效果更稳定。相似文献

7.

基于偏差自适应学习的多传感器信息融合机动目标跟踪

石晓荣《航天控制》2008,26(4)

为了保证精确打击机动目标,导弹可以采用主/被动雷达切换探测目标。考虑到作战的隐蔽性和生存性,提出基于多传感器信息融合的被动优先跟踪方法:跟踪开始时,令主/被动雷达同时对目标进行探测和跟踪,将二者的信息进行融合,同时自适应地学习融合结果与二者信息的偏差,经过一段时间学习,融合偏差稳定,此时令主动雷达停止工作,由被动雷达单独工作,而目标的运动信息则由被动雷达的信息和学习得到的融合偏差合成。如果目标机动较大,则定期令主动雷达工作以进一步修正融合偏差。该方法既保证了跟踪的精度,同时又减少了主动雷达的工作时间,从而提高了作战的隐蔽性和生存性。将该方法应用于导弹的目标跟踪,仿真结果表明该方法有效。相似文献

8.

基于强化学习的空间机械臂控制方法

李鹤宇林廷宇曾贲施国强《航天控制》2020,38(6):38-43

相似文献

9.

航天器轨道追逃博弈多阶段强化学习训练方法

下载免费PDF全文

袁利耿远卓汤亮黄煌《上海航天》2022,39(4):33-41

针对航天器轨道追逃博弈问题,提出一种多阶段学习训练赋能方法,使得追踪星在终端时刻抵近逃逸星的特定区域,而逃逸星需要通过轨道机动规避追踪星。首先,构建两星的训练策略集,基于逻辑规则设计追踪星和逃逸星的机动策略,通过实时预测对方的终端位置,设计己方的期望位置和脉冲策略,显式给出追逃策略的解析表达式,用于训练赋能;其次,为提升航天器的训练赋能效率及应对未知环境的博弈能力,提出一种基于强化学习技术多模式、分阶段的学习训练方法,先使追踪星和逃逸星分别应对上述逻辑规则引导下的逃逸星和追踪星,完成预训练;再次,开展二次训练,两星都采用邻近策略优化(PPO)策略进行追逃博弈,在博弈中不断调整网络权值,提升决策能力;最后,在仿真环境中验证提出的训练方法的有效性,经过二次训练后,追踪星和逃逸星可有效应对不同策略驱动下的对手,提升追逃成功率。相似文献

10.

GEO混合推力机动目标跟踪IMM算法

下载免费PDF全文

王常虹张大力夏红伟马广程《宇航学报》2023,(3):443-453

针对交互多模型(IMM)算法求解地球静止轨道(GEO)卫星混合推力机动目标跟踪问题时模型匹配难、模型转移概率近似平均和响应速度慢的问题,从交互模型集构建和模型转移概率自适应设计两个方面出发提出一种改进IMM算法。该方法通过考虑无机动、脉冲机动和有限推力机动三种模式,构建了覆盖目标机动状态的交互模型集,提高了模型与机动目标实际运行状态的匹配度;采用一种基于加速度估计自适应修正的模型交互概率修正方法,提升了算法对目标机动状态的响应速度和跟踪精度。仿真结果表明,所提算法是解决混合推力模式下的GEO机动目标跟踪问题的有效手段,在收敛速度和收敛精度等方面与传统方法相比有较大提高。相似文献

11.

基于强化学习的航天器姿态控制器设计

下载免费PDF全文

张瑞卿钟睿徐毅《上海航天》2023,40(1):80-85

航天器在轨执行某些任务时,其质量参数会发生未知变化,传统控制方法在这种情况下控制效果不佳。本文提出基于强化学习的航天器姿态控制器设计方法,该方法在姿态控制器训练过程中不需要对航天器进行动力学建模,不依赖航天器的质量参数。当质量参数发生较大未知变化时,训练好的控制器仍然可以保持较好的控制效果。仿真测试表明:使用基于强化学习方法训练的控制器确实具有良好的鲁棒性。此外,回报函数的设计会明显影响姿态控制器的训练,因此对不同的回报函数设计进行了研究。相似文献

12.

空间非合作目标质量特性在轨辨识

张海博王大轶魏春岭《航天控制》2015,33(3)

提出基于系统动力学方程的空间非合作目标质量特性辨识算法。利用递推最小二乘法辨识空间机器人抓捕非合作目标后系统整体的质量特性,进而根据多体动力学的建模方法,通过几何关系解算得到非合作目标与末端作用器联合体的质量特性参数。仿真分析验证了该辨识算法的有效性。相似文献

13.

基于增量学习的高光谱图像目标检测 总被引：1，自引：2，他引：1

下载免费PDF全文

张宁陈嘉杰伍伟沈霁袁杰朱新忠谢凤英《上海航天》2019,36(5):44-49

高光谱图像目标检测是高光谱图像分析中的重要研究内容之一。本文从经典有效的约束能量最小化算法出发,提出了一种基于增量学习的高光谱目标检测方法。当获得新的样本时,不需要重新计算所有样本的自相关矩阵即可对检测器模型进行更新,减轻了星上有限计算资源的负担。实验结果表明:本文提出的目标检测算法在压制背景光谱的同时可以更好地适应目标光谱,提高了算法的检测性能。相似文献

14.

基于多智能体深度强化学习的多星观测任务分配方法

下载免费PDF全文

王桢朗何慧群周军金云飞《上海航天》2024,41(1):108-115

为应对多星环境中复杂多约束条件下的任务分配场景,提出一种多星自主决策观测任务分配算法,该算法采用基于集中式训练、分布式执行的多智能体深度强化学习算法。通过这种方式训练后的卫星智能体,即使在没有中心决策节点或通信受限的情况下,仍具有一定的自主协同能力及独立实现多星观测任务的高效分配能力。相似文献

15.

在轨服务飞行器对共面圆轨道目标接近过程分析

《航天控制》2015,(4)

为了研究在轨服务飞行器(On-orbit Service Vehicle,OSV)针对共面圆轨道目标的大范围机动过程,利用经典二体动力学模型和霍曼转移轨道模型,分析了OSV转移过程中的相位调整和能量需求,比较了自然调相和速度调相的特点,提出了待机轨道、停泊轨道、初始相位差、变轨时机和交会时间等参数选择的一般规律,为选择OSV接近目标的机动策略提供了理论参考。相似文献

16.

基于深度强化学习的复杂地形适应机器人设计与实验

杨顿杨帅于洋王琪《宇航学报》2022,43(9):1176-1185

针对行星表面轻量化自主探测任务,基于仿生思想设计了一种仿海胆结构的十二足球形机器人,其具备自主改变构型以贴合复杂地形的能力,可实现无倾覆、高容错的全向运动;基于数据驱动方法,对该机器人设计了一种数据高效的无模型强化学习运动策略,可实现无先验知识的从0到1步态训练以及步态的实物样机快速部署。通过在平面地形和非结构化地形中对其进行仿真实验,验证了经过训练的机器人具备自主运动、适应非结构地形等能力;通过与常用基准策略进行对比,证实了本文提出的运动策略具有训练高效、鲁棒性好的优势;最后通过开发原理样机,开展实物实验验证了仿真环境中所生成的步态在真实物理环境中的动力学可行性。相似文献

17.

基于再励模糊神经网络的三轴稳定卫星姿态智能控制

王华刘向东《航天控制》2005,23(2):21-26

将再励学习引入模糊神经网络的T-S模型,建立了模糊神经网络控制器和控制评估网络的再励学习算法,并应用于三轴稳定卫星的姿态控制。这种再励模糊神经网络不需要精确的卫星数学模型和学习样本,通过再励学习实现控制网络/评估网络参数的在线调节,具有比较强的适应性和学习能力。仿真结果表明,这种智能控制方法可以有效解决卫星的模型不确定性问题,提高了卫星姿态控制的精度和鲁棒性。相似文献

18.

在轨服务的超近距离姿轨联合控制研究

《上海航天》2015,32(6)

对面向在轨服务的超近距离姿态轨道联合控制设计进行了研究。建立基于相对四元数的相对姿态运动动力学模型和基于相对运动轨迹设计的相对轨道动力学模型,考虑模型中姿态与轨道耦合,设计四元数反馈非线性控制律和具姿态反馈信息的最优实时闭环反馈控制律。数学仿真和半物理仿真试验结果验证了算法的有效性和可行性。相似文献

19.

基于深度学习的雷达目标识别算法评估系统设计

下载免费PDF全文

马晓萌冯舒文原昊张鹏宇沈永健《遥测遥控》2024,45(3):24-34

在雷达成像装备试验中,传统真实场景测试方法构建难度大、场景有限、试验风险高,急需解决目标识别算法测试不充分、评估不全面的问题本文针对现有问题设计了一套目标识别算法测试系统,可提供合成孔径雷达图像和逆合成孔径雷达图像的处理、标注以及目标识别算法的自动运行、环境配置、性能评估等功能。相较于传统的试验方法,该系统具备成本低、试验时间短、可控性强、可扩展等优点。相似文献