一种基于概率统计的新能源出力离散概率序列生成方法技术领域
本发明涉及一种新能源并网仿真领域的离散概率序列生成方法,具体涉及一种基于概率
统计的新能源出力离散概率序列生成方法。
背景技术
序列运算理论因其物理意义清晰,计算量小等特点,在考虑风电出力不确定性分析中得
到了广泛应用。
现阶段新能源出力概率序列生成方法,以风电概率序列为例,在使用一年的风电时序数
据生成概率序列时,首先选择一个离散化因子
(区间长度),则风电序列长度为:
![]()
式中,Wmax为全年最大风电出力,
表示不超过
的最大整数。风电序列
化的过程中,其实就是以
为区间长度,将风电时序数据的变化范围分为Nw个等长区间,统
计各离散化区间风电出现的概率Pi,作为对风电落入该离散化区间概率的统计。即,风电离
散概率序列为:
a(i)=Pi,i=0,1,2...Nw
这种新能源概率序列生成方法存在以下缺点:
1.生成多个序列进行运算时,首先要设置离散化公因子,运算后的结果要乘以离散化公
因子,才能还原到真实的功率变化区间。
2.生成序列时,实际上是用区间的下限值代表本区间的数据参与运算,这不能真实地反
映本区间的风电数据,会产生量化误差。显然,离散化步长越小,量化误差就越小,计算精
度也越高,但步长减小,将导致计算量增加。需要在权衡计算效率和精度要求的基础上选取
合适的离散化步长。
3.当时序数据样本较少且呈一定间隔分布时,常规的序列生成方法要求区间长度相等。
此时,若区间长度(离散化因子)选择不恰当,会造成时序数据集中归入某些区间,这样得
到的离散概率序列不能真实地反映原时序序列的概率特性,引起统计误差。
发明内容
为解决上述现有技术中的不足,本发明的目的是提供一种基于概率统计的新能源出力离
散概率序列生成方法,该方法中,新能源出力离散概率序列的第一行采用区间内数据期望值,
且离散化分区时,区间长度可不等间隔,避免了时序数据呈一定间隔分布时,等区间长度可
能会造成的时序数据集中归入某些区间的现象,减少序列化过程的误差。本方法还考虑了离
散值与真实值的偏差,通过与偏差的离散概率序列作卷和,得到最终的序列,更具有普遍性,
能更好地反映新能源出力的规律性。
本发明的目的是采用下述技术方案实现的:
本发明提供一种基于概率统计的新能源出力离散概率序列生成方法,其改进之处在于,
所述方法包括下述步骤:
步骤1:初步生成新能源出力离散概率序列b;
步骤2:确定离散概率序列b的偏差离散概率序列ε;
步骤3:生成最终的新能源出力离散概率序列c。
其中,所述步骤1包括下述步骤:
步骤1.1:获取并整理数据:获取一组一定时间周期(一般为一年或几个月)的新能源出
力时序数据data,所述新能源出力时序数据data总量为N;每个新能源出力时序数据不小于
0,若存在负数,将其置为0;
步骤1.2:分区:设初步生成的新能源出力时序数据data对应的离散序列是b,所划分的
区间个数为k,区间长度依次为C1,C2,…,Ck,区间长度均相等、均不相等或部分相等,则划
分的区间依次为:
[min(data),min(data)+C1),
[min(data)+C1,min(data)+C1+C2),
…,
[min(data)+C1+C2+...+Ck-1,min(data)+C1+C2+...+Ck)
式中,min(data)表示新能源出力时序数据data的最小值,且
min(data)+C1+C2+...+Ck>max(data)
式中,max(data)表示新能源出力时序数据data的最大值;
步骤1.3:确定新能源出力离散概率序列b:将新能源出力时序数据data中的每个数dataj
归入其所在的离散化区间,其中1≤j≤N,若对于步骤1.1中所分区间的第m个离散化区间,
1≤m≤k,无新能源出力时序数据data归入,则剔除第m个离散化区间,设新能源出力离散
概率序列b的长度为Lb,则:
Lb≤k
求出每个离散化区间内所有时序数据的期望值,将所述期望值作为新能源出力离散概率
序列b的第一行;
![]()
计算新能源出力时序数据落在各个离散化区间的频率,作为对新能源出力落入离散化区
间概率的估计,将所述频率作为新能源出力离散概率序列b的第二行,则:
![]()
式中,1≤ib≤Lb,表示离散概率序列b的第ib个离散化区间,nib为data在第ib个离散化
区间内的概数,b(1,ib)为第ib个离散化区间的期望值;b(2,ib)为data归入第ib个离散化区间的
概率;N是data的数据总量。
其中,所述步骤2包括下述步骤:
步骤2.1:确定新能源出力时序数据data与其所归入离散化区间的期望值的偏差数据e:
对第j个新能源出力时序数据dataj,若dataj归入b的第ib个离散化区间,则偏差ej满足下式:
ej=dataj-b(1,ib),1≤j≤N
依次求出每个新能源出力数据与其所在区间期望值的偏差,得到偏差数据e,e中的数据
有正数、负数或0,其数据总量为N;
步骤2.2:确定偏差数据e的离散概率序列ε:先划分离散化区间,然后统计偏差数据e
落在每个离散化区间的概率和期望值,确定偏差数据e的离散概率序列ε。
其中,所述步骤3包括下述步骤:设偏差离散概率序列ε的长度为Lε,新能源出力离散
概率序列b与偏差离散概率序列ε的任一组合(b(1,ib),ε(1,iε))对应的新能源离散值为:
c(1,ic)=b(1,ib)+ε(1,iε)
上述组合的概率为:
c(2,ic)=b(2,ib)·ε(2,iε)
依次求出所有组合的新能源离散值和每种组合的概率,初步生成的新能源出力离散概率
序列与偏差离散概率序列做卷和运算,得到最终的新能源出力离散概率序列c,表示为:
![]()
本发明提供的技术方案具有的优异效果是:
1.初步生成的序列b第一行采用区间内数据期望值,可以更真实精确地反映时序数据的
概率特性,避免了采用区间下边界值带来的误差。
2.最终生成的概率序列c考虑了b的离散值与真实值的偏差,通过b与ε的卷和运算,得
到最终的序列c,更具有普遍性,更能反映新能源出力的规律性。
3.区间长度可以不等间隔,避免了当时序数据样本较少且呈一定间隔分布时,等区间长
度可能会造成的时序数据集中归入某些区间的现象,减少由时序数据造成的误差,更真实地
反映时序数据的概率特性。
附图说明
图1是本发明提供的基于概率统计的新能源出力离散概率序列生成方法的流程图。
具体实施方式
下面结合附图对本发明的具体实施方式作进一步的详细说明。
以下描述和附图充分地示出本发明的具体实施方案,以使本领域的技术人员能够实践它
们。其他实施方案可以包括结构的、逻辑的、电气的、过程的以及其他的改变。实施例仅代
表可能的变化。除非明确要求,否则单独的组件和功能是可选的,并且操作的顺序可以变化。
一些实施方案的部分和特征可以被包括在或替换其他实施方案的部分和特征。本发明的实施
方案的范围包括权利要求书的整个范围,以及权利要求书的所有可获得的等同物。在本文中,
本发明的这些实施方案可以被单独地或总地用术语“发明”来表示,这仅仅是为了方便,并
且如果事实上公开了超过一个的发明,不是要自动地限制该应用的范围为任何单个发明或发
明构思。
本发明定义的新能源出力离散概率序列具体生成方法是,首先,将一定时间周期的新能
源出力时序数据,在其变化范围内分区(可等间隔分区,也可不等间隔分区),再将时序数据
一一对应到各分区,求出各区间内所有时序数据的期望值,作为序列的第一行,并统计时序
数据落在各个区间的频率,作为对新能源出力落入该离散化区间的概率的估计,得到序列的
第二行。然后,求出归入每个区间的新能源时序数据与本区间期望值的偏差,将偏差按照前
述方法也转换为离散概率序列。最后,两个序列作卷和运算,得到最终的新能源出力离散概
率序列。其流程图如图1所示,具体包括:
步骤1:初步生成离散概率序列b。
第1.1步:获取并整理数据:获取一组一定时间周期(一年或几个月)的新能源出力时
序数据data,数据总量为N。因为是新能源出力数据,理论上每个数据应不小于0。若存在
负数,将其置0。
第1.2步:分区:设初步生成的data对应的离散序列是b,区间个数为k,区间长度依次
为C1,C2...Ck,区间长度可以相等,也可以不相等,或者部分相等;则所划分的区间依次为:
[min(data),min(data)+C1),
[min(data)+C1,min(data)+C1+C2),
…,
[min(data)+C1+C2+...+Ck-1,min(data)+C1+C2+...+Ck),
其中,min(data)表示数据data的最小值,且
min(data)+C1+C2+...+Ck>max(data)
式中,max(data)表示data的最大值。
第1.3:求序列b:将data中的每个数dataj(1≤j≤N)归入其所在区间。求出每个区间内
所有数据的期望值,为b的第一行。若对第m(1≤m≤k)个区间,data无数据归入,则剔除此
区间。设b的长度为Lb,则:
Lb≤k
求出时序数据落在各个区间的频率,作为对新能源出力落入该离散化区间的概率的估计,
为b的第二行。
综上所述,
![]()
![]()
式中,1≤ib≤Lb,表示离散概率序列b的第ib个离散化区间,
为data在第ib个离散化
区间内的概数,b(1,ib)为第ib个离散化区间的期望值;b(2,ib)为data归入第ib个离散化区间的
概率;N是data的数据总量。
序列b用表格可表示为:
b(1,1)
b(1,2)
…
b(1,ib)
…
b(1,Lb)
b(2,1)
b(2,2)
…
b(2,ib)
…
b(2,Lb)
步骤2:求离散概率序列b的偏差离散概率序列ε。
步骤2.1:求出时序数据data与其所归入离散化区间的期望值的偏差数据e:对第j个新
能源出力时序数据dataj,若dataj归入b的第ib个离散化区间,则偏差ej满足下式:
ej=dataj-b(1,ib),1≤j≤N
依次求出每个新能源出力数据与其所在离散化区间期望值的偏差,得到偏差数据e,e中
的数据有正数也有负数或0,其数据总量也是N。
步骤2.2:求偏差数据e的离散概率序列ε:同理于步骤1的方法,先分区间,然后统计
偏差数据e落在每个区间的概率和期望值,求出偏差数据e的离散概率序列ε。
步骤3:序列运算求最终的离散概率序列c:
设ε的长度为Lε,对b与ε的任一组合(b(1,ib),ε(1,iε)),其对应的新能源离散值为:
c(1,ic)=b(1,ib)+ε(1,iε) (32)
此组合的概率为:
c(2,ic)=b(2,ib)·ε(2,iε) (33)
依次求出所有组合的新能源离散值和每种组合的概率,初步生成的新能源出力离散概率
序列与偏差离散概率序列做卷和运算,得到最终的新能源出力离散概率序列c,表示为:
![]()
设序列c的长度为Lc,则c用表格可表示为:
c(1,1)
c(1,2)
…
c(1,ic)
…
c(1,Lc)
c(2,1)
c(2,2)
…
c(2,ic)
…
c(2,Lc)
本发明定义的新能源出力离散概率序列的第一行采用区间内数据期望值,且离散化分区
时,区间长度可不等间隔,避免了时序数据呈一定间隔分布时,等区间长度可能会造成的时
序数据集中归入某些区间的现象,减少序列化过程的误差。本发明提供的方法还考虑了离散
值与真实值的偏差,通过与偏差的离散概率序列作卷和,得到最终的序列,更具有普遍性,
能更好地反映新能源出力的规律性。
以上实施例仅用以说明本发明的技术方案而非对其限制,尽管参照上述实施例对本发明
进行了详细的说明,所属领域的普通技术人员依然可以对本发明的具体实施方式进行修改或
者等同替换,这些未脱离本发明精神和范围的任何修改或者等同替换,均在申请待批的本发
明的权利要求保护范围之内。