期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

魏东肖志铭安硕熊亚选《控制与决策》2024,39(2):509-518

地铁站台空调系统回路众多且具有强耦合和非线性特性,PID控制方法参数整定困难,无法兼顾乘客舒适性和能效最优,由于系统建模困难,非线性优化算法计算量大,智能控制方法难以实现工程应用.对此,提出一种地铁站台空调系统预测控制策略.首先,根据热湿负荷平衡和能量守恒定律建立地铁站台热动态特性预测模型;然后,将满足乘客舒适性并节省能耗作为系统优化目标,使用神经网络作为优化反馈控制器,将系统优化目标函数作为控制器优化性能指标,结合变分法和随机梯度下降法,对神经网络控制器的权值和阈值进行在线滚动优化,算法计算量小,占用存储空间适中.仿真实验结果表明,所提出的预测控制策略与传统PID控制方法相比,在满足乘客舒适性要求的前提下,系统响应时间可缩短约39.6%,末端风机能耗降低约73.39%. 相似文献

2.

基于事件驱动深度强化学习的建筑热舒适控制

李竹傅启明丁正凯刘璐张颖陈建平《计算机应用研究》2024,41(2)

住宅暖通空调系统通常耗用大量能源,同时也极大地影响居住者的热舒适性。目前,强化学习广泛应用于优化暖通空调系统,然而这一方法需要投入大量时间和数据资源。为了解决该问题,提出了一个新的基于事件驱动的马尔可夫决策过程（event-driven Markov decision process,ED-MDP）框架,并在此基础上,提出了基于事件驱动的深度确定性策略梯度（event-driven deep deterministic policy gradient,ED-DDPG）方法,通过事件触发优化控制,结合强化学习算法求解最优控制策略。实验结果显示,与基准方法相比,ED-DDPG在提升学习速度和减少决策频率方面表现出色,并在节能和维持热舒适方面取得了显著成果。经过实验验证,该方法在优化住宅暖通空调控制方面展现出强大的鲁棒性和适应性。相似文献

3.

基于热舒适度的办公建筑HVAC系统节能控制

逯广浩汪明谢浩田孙启凯《计算机系统应用》2021,30(8):31-39

建筑节能控制是一个满足舒适需求条件下的多目标优化问题,然而对于缺失运行数据的新建建筑,如何控制供暖、通风和空调(HVAC)系统达到既舒适又节能的效果是一个控制难题.针对这个问题,本文首先建立了新建建筑空间模型,然后对该模型进行能耗仿真分析,在此基础上,提出基于人员热舒适度的模糊控制算法,得出最优控制区间,从而在较低能耗水平情况下获得更长的热舒适天数,达到既节能又舒适的目标.基于人员热舒适度的节能控制对建筑HVAC系统绿色运行具有促进作用. 相似文献

4.

基于强化学习的地铁站空调系统节能控制

焦焕炎冯浩东魏东冉义兵胡朝文《控制与决策》2022,37(12):3139-3148

地铁站空调系统能源消耗较大,传统控制方法无法兼顾舒适性和节能问题,控制效果不佳,且目前地铁站空调控制系统均是对风系统和水系统单独控制,无法保证整个系统的节能效果.鉴于此,提出基于强化学习的空调系统节能控制策略.首先,采用神经网络建立空调系统模型,作为离线训练智能体的模拟环境,以解决无模型强化学习方法在线训练收敛时间长的问题;然后,为了提升算法效率,同时针对地铁站空调系统多维连续动作空间的特点,提出基于多步预测的深度确定性策略梯度算法,设计智能体框架,将其用于与环境模型进行交互训练;此外,为了确定最佳的训练次数,设置了智能体训练终止条件,进一步提升了算法效率;最后,基于武汉某地铁站的实测运行数据进行仿真实验,结果表明,所提出控制策略具有较好的温度跟踪性能,能够保证站台舒适性,且与目前实际系统相比能源节省约17.908%. 相似文献

5.

一种基于深度学习的供热策略优化方法

李鹏易修文齐德康段哲文李天瑞《计算机科学》2022,49(4):263-268

在中国北方,冬季楼宇集中供暖采用的策略通常为气候补偿器,但是该策略严重依赖人工经验,调节相对粗放,如何优化供热控制策略对于保持楼宇室温的稳定舒适十分重要.对此,提出了一种基于深度学习的供热策略优化方法,通过学习历史真实数据信息从而对原始控制策略进行优化.首先以学习室内温度变化的热力学规律为目标,提出了一种深度多时差分网... 相似文献

6.

基于MADDPG的散装物料输送多智能体协同控制

朱奇奇李敬兆石晴刘继超胡迪《自动化技术与应用》2024,(3):10-13+34

为提升带式输送系统的智能化决策,提高生产效率,降低能耗,应用多智能体深度确定性策略梯度(MADDPG)算法,构建多输送机智能体协同控制系统。系统采用集中式结构控制多输送机,由输送机运行能耗模型,结合MADDPG算法结构,构建多智能体协同控制模型。通过训练模型,寻优输送机运行速度与煤流量最佳匹配关系,得出节能最优速度控制策略。与深度确定性策略梯度(DDPG)算法进行实验对比。结果表明,提出的多输送机智能体算法模型学习效率高,收敛速度快,具有较强的稳定性。相似文献

7.

A-DDPG：多用户边缘计算系统的卸载研究

下载免费PDF全文

曹绍华姜佳佳陈舒詹子俊张卫山《计算机工程与应用》2023,59(1):259-268

为了降低多边缘服务器多用户系统中用户的总成本,结合深度确定性策略梯度（deep deterministic policy gradient,DDPG）、长短期记忆网络（LSTM）和注意力机制,提出了一种基于DDPG的深度强化学习卸载算法（A-DDPG）。该算法采用二进制卸载策略,并且将任务的延迟敏感性和服务器负载的有限性以及任务迁移考虑在内,自适应地卸载任务,以最大限度减少由延迟敏感型任务超时造成的总损失。考虑时延和能耗两个指标并设定了不同的权重值,解决因用户类型不同带来的不公平问题,制定了任务卸载问题以最小化所有任务完成时延和能量消耗的总成本,以目标服务器的选择和数据卸载量为学习目标。实验结果表明,A-DDPG算法具有良好的稳定性和收敛性,与DDPG算法和双延迟深度确定性策略梯度（twin delayed deep deterministic policy gradient,TD3）算法相比,A-DDPG算法的用户总成本分别降低了27%和26.66%,平均达到最优任务失败率的时间分别提前了57.14%和40%,其在奖励、总成本和任务失败率方面取得了较好的效果。相似文献

8.

无线传感网络中覆盖能效动态控制优化策略 总被引：1，自引：0，他引：1

王雪马俊杰王晟《控制理论与应用》2007,24(6):964-968

能量约束是无线传感网络测量控制的关键问题之一.本文针对移动节点位置优化问题,提出了无线传感网络通信能耗评价指标,采用微粒群优化策略更新节点位置,使无线传感网络具有更强的灵活性和能效性.利用Dijkstra算法获得网络最优通信路径计算能耗评价指标.采用动态能量控制策略使空闲节点进入睡眠状态减少网络运行能耗.通过优化能量指标降低了通信能耗,实现了无线传感网络覆盖与通信能量消耗的合理均衡.对移动目标跟踪仿真表明,覆盖能效优化算法与动态能量控制策略相结合提高了无线传感网络覆盖的能效性. 相似文献

9.

基于负荷预测的冷冻站系统非线性预测控制

魏东焦焕炎冯浩东《控制理论与应用》2021,38(10):1619-1630

我国建筑能耗约占社会总能耗的30%,其中集中式暖通空调系统能耗约占一半以上.为提高节能效率,本文提出基于负荷预测的空调冷冻站系统神经网络预测控制策略.本文采用神经网络作为优化反馈控制器,将满足负荷需求和系统能效比需求作为优化目标,将变分法和随机梯度下降法相结合,对神经网络权值进行滚动优化,既能解决传统变分法由开环控制引发的对随机干扰和不确定性敏感的问题,又可避免基于动态规划的非线性优化算法的"维数灾"问题.本文以北京某国企科研楼的空调系统为研究对象,实验结果表明,本文所提出的神经网络预测控制策略与PID控制算法相比,系统总能耗节省约8.57%,并且在控制过程中能够克服各种变化和不确定性因素的影响,具有更好的动态和稳态性能,且该算法占用存储空间适中、计算量小,易于工程实现. 相似文献

10.

考虑舒适度的制造环境中HVAC节能优化控制研究

周礽恺林文文方志梅《计算机应用与软件》2021,38(2):43-49

针对制造系统中HVAC高能耗的问题,通过分析制造环境中的热量对HVAC与温度的影响,建立了考虑舒适度的HVAC节能优化模型,并运用模拟退火算法优化目标函数。实验结果表明,HVAC节能优化模型不仅降低了5.9%的能耗,而且室内温度范围在28~29℃,符合节能与舒适的双标准。相似文献

11.

Data-driven modeling and optimization of thermal comfort and energy consumption using type-2 fuzzy method

Chengdong Li Guiqing Zhang Ming Wang Jianqiang Yi 《Soft Computing - A Fusion of Foundations, Methodologies and Applications》2013,17(11):2075-2088

In the research domain of intelligent buildings and smart home, modeling and optimization of the thermal comfort and energy consumption are important issues. This paper presents a type-2 fuzzy method based data-driven strategy for the modeling and optimization of thermal comfort words and energy consumption. First, we propose a methodology to convert the interval survey data on thermal comfort words to the interval type-2 fuzzy sets (IT2 FSs) which can reflect the inter-personal and intra-personal uncertainties contained in the intervals. This data-driven strategy includes three steps: survey data collection and pre-processing, ambiguity-preserved conversion of the survey intervals to their representative type-1 fuzzy sets (T1 FSs), IT2 FS modeling. Then, using the IT2 FS models of thermal comfort words as antecedent parts, an evolving type-2 fuzzy model is constructed to reflect the online observed energy consumption data. Finally, a multiobjective optimization model is presented to recommend a reasonable temperature range that can give comfortable feeling while reducing energy consumption. The proposed method can be used to realize comfortable but energy-saving environment in smart home or intelligent buildings. 相似文献

12.

基于近端策略优化算法含碳捕集的综合能源系统低碳经济调度

王桂兰张海晓刘宏曾康为《计算机应用研究》2024,41(5)

为了实现园区综合能源系统（PIES）的低碳化经济运行和多能源互补,解决碳捕集装置耗电与捕碳需求之间的矛盾,以及不确定性源荷实时响应的问题,提出了基于近端策略优化算法含碳捕集的综合能源系统低碳经济调度方法。该方法通过在PIES中添加碳捕集装置,解决了碳捕集装置耗电和捕碳需求之间的矛盾,进而实现了PIES的低碳化运行;通过采用近端策略优化算法对PIES进行动态调度,解决了源荷的不确定性,平衡了各种能源的供给需求,进而降低了系统的运行成本。实验结果表明：该方法实现了不确定性源荷的实时响应,并相比于DDPG（deep deterministic policy gradient）和DQN（deep Q network）方法在低碳化经济运行方面具有有效性及先进性。相似文献

13.

遗传算法在列车运行控制模型中的应用

周庆飞戴胜华李正交李窍盛《计算机系统应用》2014,23(9):102-106

针对轨道交通列车节约能耗、节省时间和提高舒适度等因素之间的冲突问题,建立了以工况转换点为求解目标的多约束条件下列车运行优化控制模型,并提出了弯道优行法的列车通行原则,优化了弯道运行策略.对模型进行分析,应用遗传算法对该问题进行求解,最后采用MATLAB软件进行仿真验证.仿真结果表明,该模型方法能够有效的优化列车运行模式,在运行时间只延长11.96%的情况下,能耗降低了33.27%,并保证了乘客的舒适度,最终得到了比较理想的运行策略. 相似文献

14.

融合类人驾驶行为的无人驾驶深度强化学习方法

吕迪徐坤李慧云潘仲鸣《集成技术》2020,9(5):34-47

现有无人车辆的驾驶策略过于依赖感知-控制映射过程的“正确性”,而忽视了人类驾驶汽车时所遵循的驾驶逻辑。该研究基于深度确定性策略梯度算法,提出了一种具备类人驾驶行为的端到端无人驾驶控制策略。通过施加规则约束对智能体连续行为的影响,建立了能够输出符合类人驾驶连续有序行为的类人驾驶端到端控制网络,对策略输出采用了后验反馈方式,降低了控制策略的危险行为输出率。针对训练过程中出现的稀疏灾难性事件,提出了一种更符合控制策略优化期望的连续奖励函数,提高了算法训练的稳定性。不同仿真环境下的实验结果表明,改进后的奖励塑造方式在评价稀疏灾难性事件时,对目标函数优化期望的近似程度提高了 85.57%,训练效率比传统深度确定性策略梯度算法提高了 21%,任务成功率提高了 19%,任务执行效率提高了 15.45%,验证了该方法在控制效率和平顺性方面具备明显优势,显著减少了碰撞事故。相似文献

15.

基于自监督网络的DDPG算法的建筑能耗控制

殷雨竹陈建平傅启明陆悠吴宏杰《计算机系统应用》2022,31(2):161-167

针对强化学习方法训练能耗控制系统时所存在奖赏稀疏的问题,将一种基于自监督网络的深度确定策略梯度(deep deterministic policy gradient,DDPG)方法应用到建筑能耗控制问题中.首先,处理状态和动作变量作为自监督网络前向模型的输入,预测下一个状态特征向量,同时将预测误差作为好奇心设计内部奖赏... 相似文献

16.

面向高铁站的热舒适度和能耗综合预测

蒋阳升王胜男涂家祺李莎王红军《计算机应用》2021,41(1):249-257

针对高铁站这类半封闭建筑的热舒适度影响因素众多,影响机制复杂以及热舒适度与能耗存在背反等问题,提出了基于机器学习的高铁站热舒适度与能耗综合预测方法。首先采用传感器数据捕获及Energy Plus仿真两种方式对高铁站室内外状态、多联机及热交换机等控制单元及热能传导环境进行建模;其次提出影响高铁站热舒适度的八类因素——多联机开启台数、多联机设置温度、热交换机开启台数、客流密度、室外温度、室内温度、室内湿度和室内二氧化碳浓度,并设计424种模型运行工况以及3 714 240个实例;最后设计6种机器学习模型——深度神经网络、支持向量回归、决策树回归、线性回归、岭回归和贝叶斯岭回归,来对高铁站室内热舒适度和空调能耗进行有效预测。实验结果表明,6种机器学习模型中决策树回归预测模型能够在较短的时间内获得最优的预测性能,其平均均方误差低至0.002 2。所得研究成果可直接为下一阶段的温控策略提供主动预判的环境状态参数并实现实时决策。相似文献