基于平行CPSS结构的智慧能源调度机器人及其知识自动化理论

项目来源

国家自然科学基金(NSFC)

项目主持人

余涛

项目受资助机构

华南理工大学

立项年度

2017

立项时间

未公开

项目编号

51777078

研究期限

未知 / 未知

项目级别

国家级

受资助金额

55.00万元

学科

工程与材料科学-电气科学与工程-电力系统与综合能源

学科代码

E-E07-E0704

基金类别

面上项目

关键词

信息—物理—社会融合系统 ; 智能控制 ; 知识自动化 ; 智慧能源 ; 机器人 ; Intelligent Control ; Smart Energy ; Cyber-physical-social systems ; Knowledge Automation ; Robot

参与者

王克英;李力;程乐峰;瞿凯平;殷林飞;潘振宁;王德志;郑宝敏

参与机构

悉尼科技大学

项目标书摘要:本项目着眼于能源5.0 前瞻性基础理论研究,重点攻关基于信息—物理—社会融合系统(CPSS)的智慧能源调度机器人RoboEC群体及其知识自动化的关键理论方法:研究面向下一代能源电力系统的平行CPSS理想框架及工程可行框架体系;研发基于数据驱动及自校正引导方法的新型高精度镜像仿真方法,实现镜像系统对真实物理系统的趋优引导;研究面向未来能源电力系统集中/分散调度的平行机器学习方法和知识自动化技术,实现RoboEC群体的知识自我探索和群体智慧水平的自动提升;研究平行系统与真实系统的交互协调收敛数学机理及实现CPSS大闭环的系统化设计方法,获得能源、信息、社会三者的深度融合方法和系统化工程设计方法;研发并完善基于平行CPSS架构的RoboEC研究平台,将所研发的RoboEC投入到小规模实际工程运行测试,力争在“能源4.0”到“能源5.0”的技术发展之路上先行一步。

Application Abstract: This project attempts on systematically developing the key theories of“Energy 5.0”based on smart energy robot dispatcher RoboEC,in which the theoretical and application structure of next generation of energy system called CPSS will be thoroughly investigated.In addition,novel high-precision mirror simulation approaches will be developed based on data-driven and self-correction mechanisms,such that an optimal approximation from the mirror system to the physical system can be achieved.Moreover,parallel machine learning and knowledge automation will be comprehensively studied for centralized/decentralized dispatch of future energy power systems,which can effectively achieve a knowledge self-exploration of RoboECs as well as significantly enhance the swarm intelligence.Besides,the convergence property between the coordinated parallel system and real system will be studied in depth,together with the design of global closed-loop CPSS system,so that a highly incorporated and systematic engineering design of energy,information and society can be realized.Lastly,a small-scale experiment project will be used for testing the engineering feasibility of theoretical results with the ambitious aims to make the substantial scientific progress from“Energy 4.0”to“Energy 5.0”.

项目受资助省

广东省

项目结题报告(全文)

在能源变革新形势下,电网调度运行面临的挑战愈发严峻。海量新能源和柔性负荷渗透率不断增加,电网运行方式的不确定性日益增加;“源—网—荷—储”协同运行导致各层级电网调度对象和数量呈指数级增加,调度人员实时决策压力剧增;电力市场下多方主体利益博弈显著加剧电网运行的不确定性,电力系统最优调度决策的复杂度急剧增加。在此背景下,调度自动化对智能调度的需求愈加迫切,本项目立项时拟研究基于智慧能源调度机器人RoboEC的能源5.0关键基础理论和方法,并尝试小规模工程验证。围绕原项目立项设定的研究内容,研究了面向下一代能源电力系统的平行CPSS系统理想框架及工程可行框架体系。研究了平行人工系统建模方法以及多主体电力市场演化博弈的收敛性,研发电力市场和碳市场出清模型和仿真程序,并搭建平行CPSS系统实验室研究平台。研究集中调度模式下单一智慧能源调度机器人RoboEC的知识自动化流程与并行机器学习方法。研究分散调度模式下智慧能源调度机器人群体RoboECs的知识自动化流程、人工社会建模与并行机器学习方法。研究平行系统与真实系统的交互协调机理,研究RoboECs在CPSS系统大闭环中实现自我博弈和平行学习的理论方法,提出统一时间尺度的深度强化学习智能调度脑,在典型综合能源系统和微电网系统算例进行验证,取得令人振奋的结果。该项目成果可推广至电网的数字孪生系统开发和建设。以电网的真实数据,构建用于RoboEC平行学习的数字孪生系统,实现区域电网运行数据的全要素接入,基于“知识+数据”驱动的建模技术对电网物理系统和运行场景进行数字化构建,实现孪生系统与物理系统的实时映射;系统搭载基于大数据驱动的运行场景生成算法,为RoboEC平行学习提供丰富样本;构建复杂调控场景的“过去—现在—平行—未来”多时态决策推演模型,为RoboEC平行学习提供与物理系统高度真实的探索环境。实现源网荷储联合优化运行,提升电网的新能源消纳能力和电网安全稳定性。项目提出的CPSS体系架构已应用于南方电网和国家电网重点科技示范工程项目,在东莞松山湖和河南兰考两个平行系统/数字孪生示范工程项目已应用。该项目获得省部级科技奖励4项,发表/录用论文58篇,其中,SCI一区收录20篇、ESI高被引2篇,F5000中国精品论文1篇;发明专利授权5项,出版专著1部。项目负责人获批广东省珠江学者。成果超过原申请书计划,达到结题要求。

  • 排序方式:
  • 1
  • /
  • 1.智能配电网日内优化调度及其随机动态规划策略

    • 关键词:
    • 智能配电网;经济调度;随机动态规划;随机优化;在线优化;分布式优化;多智能体系统
    • 潘振宁
    • 指导老师:华南理工大学 余涛
    • 学位论文

    随着可再生能源、储能、需求侧资源等分布式设备的大量接入,智能配电网源荷两侧多重不确定性对于系统安全运行有着显著影响。研究能够根据系统实时状态而动态调整决策的日内优化调度策略,对于促进可再生能源消纳、提升系统运行水平意义重大。智能配电网日内优化调度本质上是一个具有高维连续-离散状态决策空间和复杂约束的随机序贯决策问题。电力系统中常用的日内优化调度算法存在过度依赖预测信息、计算复杂和最优性难以保证等缺点。以随机动态规划(Stochastic dynamic programming,SDP)或强化学习理论为代表的智能化方法近年来在电力系统复杂调控问题中的应用受到关注,但算法仍普遍存在高维度问题下策略寻优困难、复杂约束下决策可行性差等问题。本论文以多重不确定环境下智能配电网的日内优化调度为切入点,以问题为导向,由浅入深地从凸问题到非凸问题、单一能源网络到多能耦合网络、集中式调度到分布式调度等多个角度研究了智能配电网日内优化调度问题,并提出了一整套决策最优、求解高效、适应性强、易于应用的SDP算法。具体研究内容如下:1)针对大规模电动汽车接入后,原问题的高维数及维数不确定导致策略求解困难的问题,提出一种基于SDP的双层优化框架和在线决策算法。首先,提出了电动汽车集群的等效建模方法并构建双层优化调度架构,大幅降低并固定了问题的维度。其次,提出了基于SDP的最优日内调度策略,分析并利用了值函数的凹性,提出了策略快速寻优算法。算例表明:提出的算法收敛性好、决策鲁棒性强、计算时间受底层设备数量的影响小,可以很好地适应未来“小容量、大数量”的灵活分布式资源广泛接入智能配电网的新形势。2)针对以最小化序贯决策成本期望为目标的传统算法,在重尾分布的随机场景下容易产生高成本的风险,提出了基于动态风险度量SDP的日内优化调度策略。首先,建立了多能耦合智能配电网的模型,综合利用电网和热网两侧的灵活性资源,克服系统的随机性。其次,基于风险马尔科夫决策过程,建立了动态风险度量下的日内优化调度最优决策模型。最后,提出了基于数据驱动的改进值函数近似策略,实现对最优策略的快速学习。算例表明:所提出的模型和算法既有效提升了系统运行的经济性,又显著降低了极端场景下可能出现的高成本,避免了不必要的削负荷和弃风弃光。3)针对非凸的日内优化调度问题下传统算法存在策略寻优困难的问题,提出了值函数近似方法。首先,建立了考虑热储能接入下的多能耦合智能配电网日内优化调度模型,原问题是一个含多重不确定性的复杂非凸问题,1)和2)的方法无法求解。其次,对原问题进行时段分解,提出了基于SDP的日内优化调度策略。最后,证明并利用了值函数的单调性,以克服原问题的维数灾难,并利用专家示范数据进一步加速离线学习过程。算例表明:提出的SDP算法的决策接近最优且鲁棒性强,可以实现此类复杂日内优化调度问题的秒级决策。4)基于3)中提到的智能配电网日内优化调度模型,进一步探索便于实际工程应用,适合求解复杂电力系统日内优化调度问题的启发式策略。首先,提出了代价函数近似的SDP策略,将复杂的值函数近似问题转变为基函数参数寻优问题。其次,提出了基于模仿学习的策略寻优架构,将策略寻优问题转换成一系列监督学习问题,实现专家示范数据下的策略快速寻优。最后,采用了可获得全局解的迭代算法求解模仿学习下的混合整数双层优化问题。算例表明:和3)中的SDP算法相比,提出的算法牺牲了一定的最优性和鲁棒性,但因其结构简单、策略寻优方便,更便于实际工程中对于复杂问题求解。5)针对传统分布式优化算法在日内调度决策时需要巨大通讯量和计算量的问题,提出了在线计算时可少迭代甚至非迭代运行的多智能体SDP算法。首先,建立了含多微网的配电网日内分布式优化调度模型,提出了基于异质分解的交互能源控制(TEC)架构并论证了其最优性。其次,提出了与TEC机制相兼容的多智能体SDP算法并论证了其最优性。最后,提出了最优策略的群体学习算法,实现无须交互额外信息下,策略的分布式自寻优。算例表明:提出的算法与集中式SDP算法优化结果相同,在线决策计算效率极高,决策对于随机环境具有很强的鲁棒性,适合弱中心化条件下系统的分布式决策。

    ...
  • 2.电力市场多群体策略博弈的长期演化稳定均衡理论研究

    • 关键词:
    • 智能电网;电力市场;演化博弈理论;Lyapunov稳定性理论;多群体策略博弈;演化稳定策略;演化稳定均衡;纳什均衡;复制者动态;渐进稳定均衡点;对称与非对称;同质性与异质性;相对净支付;发电市场;长期竞价;长期互动;电力需求侧响应管理;复杂网络;信息-物理-社会融合系统;智慧能源调度机器人
    • 程乐峰
    • 指导老师:华南理工大学 余涛
    • 学位论文

    为解决开放竞争性电力市场下日益复杂的多主体优化决策问题,博弈论逐渐成为一种十分有效的数学工具。演化博弈论作为博弈论的新兴分支,建立在“有限理性”和“有限信息”假设基础上,更加适用于实际博弈情形。目前,演化博弈论在电力市场中的相关研究处于很大的空白状态。为此,本文立足于演化博弈论中的演化稳定策略、复制者动态、演化稳定均衡等核心概念,并结合李雅普诺夫稳定性理论,对开放的供给侧与需求侧电力市场中多群体策略博弈问题的长期演化稳定均衡特性进行了深入的理论研究,旨在拓展演化博弈论在电力市场中的应用范围,并为该领域内非完全理性利益群体复杂的动态交互行为决策问题的研究提供一种有效的解决途径。本文研究成果阐述如下。首先,提出了一个适合于对多群体策略博弈的长期演化稳定均衡特性进行理论分析与动态仿真研究的方法体系。该体系中的模型、方法与所得结论均具有一定的普适性和有效性,可为本文后面章节关于电力市场多群体策略博弈长期演化稳定均衡特性的理论研究奠定基础,并可用于智能电网相关领域内尤其开放竞争性电力市场环境下非完全理性主体参与的多群体策略式演化博弈的长期动态交互行为决策问题的研究。其次,基于上述研究方法体系,提出了适合于分析电力市场下典型两群体和三群体非对称演化博弈场景的长期演化稳定均衡特性的理论研究方法。其中,以两类发电商群体长期参与发电侧电力市场竞价为典型两群体非对称演化博弈场景,以电网公司、新增供电实体和电力消费用户长期参与需求侧电力市场电价与电量交易为典型三群体非对称演化博弈场景,经研究表明:上述场景存在数量不同的长期演化稳定均衡状态,且都是严格的Nash均衡状态;此外,通过政府对相应市场进行有效监督,将影响上述典型两群体和三群体非对称演化博弈场景的支付矩阵,进而改变整个市场的渐进稳定均衡点分布,最终引导市场的博弈均衡朝着期望的长期演化稳定均衡处收敛。这有助于市场电价的平缓稳定、促进电网削峰填谷、提高各方收益,同时使电力市场的资源配置率得到显著提升,保证电力市场的长期健康稳定运行。然后,基于上述典型场景研究,提出了适合于分析供给侧电力市场中同质性和异质性发电市场长期竞价演化稳定均衡特性的理论研究方法。首先,针对同质性发电市场,经理论研究表明:该市场最终的长期竞价演化稳定均衡将由6组定义的相对净支付参数决定,且市场总计存在64种长期竞价博弈场景。此外,在这些场景下,市场总计存在288组长期竞价演化博弈状态,其中包括82组竞价演化稳定均衡状态、85组竞价演化不稳定均衡状态和121组竞价演化临界均衡状态(仍是不稳定的)。其次,针对异质性发电市场,经定性理论研究表明:若无政府监督,该市场会自发形成9种演化稳定的竞价策略,而有政府监督情况下则最终只会在3种竞价策略处达到长期演化稳定均衡状态,且该状态仅由市场的相对净支付参数决定;此外,经定量理论研究表明:当市场的总发电量需求相同且未能完全满足所有发电商群体的总发电容量之和时,“市场统一出清结算机制(即MCP结算机制)”比“按报价结算机制(即PAB结算机制)”更易于引导所有发电商群体报低价策略参与竞价上网。此时,在“市场统一出清结算机制(MCP)”下,整个电力供给侧异质性发电市场的电价波动更小,更有利于其长期健康稳定运行。继而,基于上述典型场景研究,提出了适用于分析需求侧电力市场中家庭用户群体与供电实体间长期互动演化稳定均衡特性的理论研究方法。该方法中,提出了非完全理性用户群体参与电力需求侧响应管理过程中与供电实体长期互动的N群体非对称演化博弈模型,其优势在于:立足于用户种群有限理性和有限信息特征,充分利用演化博弈论描绘用户在电力需求侧响应管理中的群体行为的变化趋势并准确预测用户个体的群体行为,使其更加贴近于用户群体参与智能用电调配时与供电实体间的实际动态交互决策情形。针对上述模型的算例研究表明:在多个家庭用户种群与供电实体间的长期动态交互决策过程中,通过供电实体提供合理丰厚的电价激励对于引导和促进多个用户群体积极参与电网智能用电调配起到了关键性作用。此时,在趋利性、趋同性以及不断的动态交互驱动下,所有用户种群将以极大比例(本文将其定义为用户参与度)在“选择参与智能用电调配”这一策略处达到长期演化稳定均衡状态。这对于电网安全稳定运行水平的提高、削峰填谷效益的提升、以及智能电网的健康发展都具有重要的意义。此外,其他因素如用户参与度初始值、舒适度效用函数形式及其关键参数设置、用户种群数量和种群规模等均会在一定程度上影响各种群的用户参与度和相关收益的最终演化趋势,但它们相比于电价激励所起到的促进作用较弱,几乎可忽略。最后,本文对上述研究工作进行了总结,并对其下一步研究方向进行了展望。其中,尤其针对开放竞争性电力市场环境下的智能电网复杂演化博弈领域,以“智慧能源调度机器人”这一“信息-物理-社会系统”高度融合的高级智能电网形式为例,对复杂网络上的演化博弈理论在该领域复杂智能调度与控制策略研究中的应用进行了展望。

    ...
  • 排序方式:
  • 1
  • /