排序方式: 共有55条查询结果,搜索用时 0 毫秒
51.
52.
深度强化学习算法能够很好地实现离散化的决策行为,但是难以运用于高度复杂且行为连续的现代战场环境,同时多智能体环境下算法难以收敛。针对这些问题,提出了一种改进的深度确定策略梯度(DDPG)算法,该算法引入了基于优先级的经验重放技术和单训练模式,以提高算法收敛速度;同时算法中还设计了一种混合双噪声的探索策略,从而实现复杂且连续的军事决策控制行为。采用Unity开发了基于改进DDPG算法的智能军事决策仿真平台,搭建了蓝军步兵进攻红军军事基地的仿真环境,模拟多智能体的作战训练。实验结果显示,该算法能够驱动多作战智能体完成战术机动,实现绕过障碍物抵达优势区域进行射击等战术行为,算法拥有更快的收敛速度和更好的稳定性,可得到更高的回合奖励,达到了提高智能军事决策效率的目的。 相似文献
53.
54.
对自制的环氧小麦秸秆纤维素球进行改性,制备了两种改性小麦秸秆纤维素球。用正交设计法设计实验方案,探讨了其制备的优化实验条件。实验结果表明:当三乙胺盐酸盐溶液体积为4 mL、无水碳酸钠的用量为0.6 g、溶剂为30%乙醇溶液、反应时间为6 h时,制得的三乙胺盐酸盐改性小麦秸秆纤维素球(WS-MB-TEAHC)对Cu2+的吸附容量最大;当乙二胺盐酸盐溶液体积为8 mL、无水碳酸钠的用量为0.6 g、溶剂为30%二氧六环、反应时间为6 h时,制得的乙二胺盐酸盐改性小麦秸秆纤维素球(WS-MB-EDADHC)对Cu2+的吸附容量最大。红外光谱表征显示:环氧小麦秸秆纤维素球的环氧基参与了反应,改性后引入了含N官能团。 相似文献
55.