基于深度强化学习组合优化的配电网拓扑控制研究 |
| |
引用本文: | 闫冬,彭国政,高海龙,陈盛,周钰山.基于深度强化学习组合优化的配电网拓扑控制研究[J].电网技术,2022(7):2547-2554. |
| |
作者姓名: | 闫冬 彭国政 高海龙 陈盛 周钰山 |
| |
作者单位: | 1. 中国电力科学研究院有限公司;2. 国网江苏省电力有限公司徐州供电分公司 |
| |
基金项目: | 国家电网有限公司总部科技项目(5700-202018266A-0-0-00)~~; |
| |
摘 要: | 基于深度强化学习的配电网故障恢复拓扑控制策略,文章首先设计配电网拓扑状态表征和决策动作规则支撑组合优化求解;其次,利用改进指针网络结构配合深度强化学习算法实现适用于多类故障恢复策略的模型自学习和端到端计算;最后,通过改进掩码机制降低探索求解复杂度进而提升训练学习效率。通过在预设条线路上随机设置故障组合,在单一和混合初始状态样本集上验证文章提出的改进机制和模型计算有效性,以期为深度学习技术在配电网运行方式优化研究提供有效参考。
|
关 键 词: | 深度强化学习 拓扑控制 组合优化 指针网络 |
|
|