基于小波变换样本熵和深度核极限学习机的电压暂降源辨识

汪 颖, 敬志凤

(四川大学 电气工程学院, 四川 成都 610065)

电压暂降是电力系统运行时不可避免的一种短时电压波动现象。现代化工厂和工业园区中广泛使用了电压暂降敏感设备,敏感设备遭受电压暂降后,会使设备无法正常运行,导致残次品产出、设备损坏和生产中断,给用户带来严重的经济损失[1-3]。因此,电压暂降问题得到了供用电双方的广泛关注,而准确辨识电压暂降源对电压暂降预防和处理、供用电双方责任划分具有重要意义[4-5]。

目前,国内外关于电压暂降源辨识的研究已取得了一些成果。文献[6]采用B样条小波变换提取电压暂降波形特征量,并以识别系数和波形相似性作为辨识依据;
但阈值的选择对结果有较大影响。文献[7]直接采用卷积神经网络提取电压暂降波形的数字特征,采用深度置信网络识别电压暂降源类型;
但该模型复杂、计算量大。文献[8]定义了三相不平衡度、交叉不平衡度,并结合马氏距离和概率神经网络,实现了复合电压暂降源的分类与识别;
但识别阈值不易设定。文献[9]以电压暂降波形数据建立了波形库,采用动态时间弯曲距离法计算实测电压暂降波形与波形库中每个数据间的距离,以距离最小为依据对电压暂降类型进行辨识;
但存在畸形匹配。文献[10]考虑了雷击导致的电压暂降,采用希尔伯特-黄变换提取特征,应用决策树识别电压暂降类型。文献[11]选取三相电压不平衡度、电压暂降持续时间比以及二次谐波增量作为评价指标,采用模糊综合评价法来实现电压暂降源的识别;
但识别过程过于复杂。文献[12]通过直接提取电压暂降波形的统计特征来构建特征序列,采用熵权法改进的灰色关联分析计算参考序列和比较序列之间的关联度大小,进而实现电压暂降类型的识别;
但该方法无法对关联度相等的情况作出判别。

根据以上分析,本文提出一种基于小波变换样本熵和深度核极限学习机的电压暂降源辨识方法。通过小波变换对电压暂降信号进行多层分解,并计算小波系数的样本熵,以构建特征向量,进而以极限学习机、自编码器和核函数为基础构建深度核极限学习机模型,并将特征向量作为模型输入。通过仿真验证与对比分析,所提方法可实现电压暂降源的准确辨识,且具有良好的抗噪声性能。

小波变换的多分辨分析和抗噪声能力强,可移植性好,可同时表征电压暂降源所引起的非平稳电压信号在时、频域中的特征。基于小波变换分解得到的小波系数计算其样本熵,作为辨识特征输入到深度核极限学习机中,可减小数据维度,提升辨识过程的效率。

1.1 常见电压暂降源分析

短时间内从系统中汲出一个大电流并在系统中流通,造成系统阻抗上的分压增加,是导致电压暂降事件发生的根本原因。而短路类故障、变压器投切与感应电动机启动是产生大电流的最主要原因,也是最常见的电压暂降源类型[13]。典型的电压暂降波形如图1所示,其中短路类故障以两相接地短路为例。

由图1可知,电压暂降发生瞬间,其电压幅值会迅速降低,且短路故障导致的电压暂降残余电压通常最小;
当继电保护动作切除故障,短路故障导致的电压暂降幅值迅速恢复,而变压器投切和感应电动机因线圈的存在,使得恢复过程较为缓慢。此外,仅短路故障导致的电压暂降幅值在持续过程中是保持不变的,并且仅三相短路故障和感应电动机启动导致的电压暂降是对称电压暂降,其余为非对称电压暂降。这是因为变压器投切瞬间,三相电压的初始相角总是互差120°,且铁芯的饱和程度不等,故而引起非对称的激磁涌流,造成不对称电压暂降。

图1 常见电压暂降源的波形示意图Fig.1 Waveform diagram of common voltage sag sources

1.2 小波变换

假定ψ(t)∈L2(R)(L2(R)是平方可积实数空间)的傅里叶变换结果φ(ω)满足:

(1)

此时ψ(t)称为一个母小波。对ψ(t)进行伸缩与平移操作即可得到连续小波基函数,即:

(2)

式中:a、b分别为伸缩因子、平移因子。

对于一个连续的电压暂降信号U(t),将其连续小波变换定义为:

(3)

在实际情况中,常采用离散小波变换,故令连续变量a=2-j、b=2-jk,j,k∈Z,得到:

(4)

因此,U(t)的离散小波变换定义为:

DWf(j,k)=

(5)

1.3 样本熵

样本熵在2000年由Richman提出,用于衡量序列复杂度。若序列的自相似性越高,则样本熵的值越小;
若序列越复杂,则样本熵的值越大[14]。对于同类电压暂降源造成的电压暂降的电压瞬时值波形,其自相似性和复杂度都很接近,因此,将采用小波变换后所得分量的样本熵作为电压暂降源的辨识特征。

假定电压暂降波形U(t)经小波变换后的分量序列表示为:x(1),x(2), …,x(N),N为数据点的总个数,则样本熵的具体计算过程为[15-16]。

1) 将分量序列按顺序组成m维向量,即:

Xm(i)=[x(i),x(i+1),…,x(i+m-1)]

(6)

式中:i=1,2,…,N-m+1。

2) 将两向量Xm(i)、Xm(j)对应元素的最大差值的绝对值定义为两向量之间的距离,即:

(7)

式中:1≤j≤N-m+1,且j≠i。

(8)

同时,定义两序列在r下匹配m个点的概率Bm(r)的表达式为:

(9)

4) 增加维数至m+1,重复步骤1)~3)得:

(10)

同样,定义两序列在r下匹配m+1个点的概率Am(r)的表达式为:

(11)

5) 因此,与分量序列对应的样本熵定义为:

(12)

当N取有限值时,样本熵的估计值为:

(13)

1.4 特征量的提取

特征量对电压暂降源的准确辨识至关重要。因此,采用db4小波对图1所示的电压暂降每相电压瞬时值波形的数据段进行7层分解,得到1个近似分量cA7和7个细节分量(cD1,cD2,…,cD7),并根据1.3节所述内容计算这8个分量相应的样本熵,从而形成8维的特征向量F(·),即:

F(·)=[SEcA7,SEcD1,SEcD2,…,SEcD7](14)

小波变换样本熵可量化电压暂降波形波动的规律性和不可预测性,能反映电压暂降波形中新信息发生的可能性,即在时频域内,通过度量近似分量和细节分量的复杂度,反映出电压暂降信号的非线性特征。考虑到采集得到的电压暂降数据通常为三相电压,因此,对每相单独提取特征向量,从而构建与三相电压相对应的24维特征向量F,即:

F=[F(A),F(B),F(C)]

(15)

式中:A、B和C分别表示A相、B相和C相。

电压暂降源的辨识实质上是分类问题,即分类模型对输入的特征向量进行学习和判断,进而输出电压暂降源的类别;
而电压暂降源的准确快速辨识,依赖于所建立的辨识模型及该模型对输入特征的学习能力。深度核极限学习机(deep kernel extreme learning machine,DK-ELM)具有多个隐含层,可实现对输入特征的映射,能获得较多更有用的信息,且DK-ELM能够快速学习,并具有良好的稳定性和泛化能力。因此,将采用DK-ELM对提取特征进行学习,并利用训练好的DK-ELM实现电压暂降源的准确辨识。DK-ELM的构建基础是极限学习机(extreme learning machine,ELM)和自编码器。

2.1 极限学习机模型

随机初始化ELM的输入权重和隐含层偏置,并计算得到相应的输出权重[17]。对于K个任意样本(Zh,Yh),其中Zh=[zh1,zh2,…,zhs]T∈Rs为维度为s的输入样本,Yh=[yh1,yh2,…,yhd]T∈Rd为维度为d的输出样本,且1≤h≤K,则包含λ个隐含层节点的ELM输出可表示为:

(16)

式中:g(·)为激活函数;
Wc=[ωc1,ωc2,…,ωcs]T为输入权重;
βc为输出权重;
bc为与第c个隐含层节点对应的偏置。

当ELM实现零误差输出时,则存在βc、Wc及bc满足:

Hβ=Y

(17)

训练过程可转化为求解式(17)的线性系统,即:

β=H+Y

(18)

式中,H+为矩阵H的Moore-Penrose广义逆。

为改善ELM模型的泛化能力,在式(18)中引入正则化参数θ,从而求得β为[18]:

(19)

式中:I为单位矩阵。

进一步,ELM的输出g(z)可表示为:

(20)

式中:z为输入向量;
h(z)=H为隐含层的随机映射矩阵。

2.2 极限学习机自编码器模型

ELM无需迭代,能实现快速训练,但随机生成的输入权重和隐含层偏置易造成某些节点无效,从而降低对某些重要特征的学习效率。为此,可采用ELM自编码器(ELM auto-encoder,ELM-AE)模型来有效避免上述问题,其结构如图2所示。ELM-AE的原理为[19-20]。

1) 通过ELM模型得到正交随机输入权重W和隐含层偏置b,即:

(21)

式中:W=[W1,W2,…,Wλ];
b=[b1,b2,…,bλ]。

2) 将输入样本构成的矩阵Z映射至隐含层的特征空间,通过重构矩阵ξ将隐含层输出矩阵重构为原来的输入矩阵,即满足Z=Hξ。此时,重构矩阵ξ的表达式为:

(22)

3) 将解得的重构矩阵ξ的转置矩阵作为原网络结构输入层与隐含层的权重矩阵。

经过ELM-AE的处理,输入权重得到了优化,相较于随机确定,该模型提高了网络的性能。

图2 ELM-AE网络结构Fig.2 Structure of ELM-AE

2.3 DK-ELM模型的具体实现

DK-ELM是以ELM-AE为基础,将多个ELM-AE进行堆叠,构建得到的含有多个隐含层的深度神经网络,具有将初始特征映射到新的特征空间,进而获得更多重要信息的功能,可在保证学习效率的前提下提高辨识精度;
同时,考虑到ELM将输入样本以随机映射的方式映射到隐含层会影响模型的稳定性和泛化能力,因此,引入核函数,以核映射代替其随机映射。其模型的网络结构如图3所示。

图3 DK-ELM结构Fig.3 Structure of DK-ELM

DK-ELM的具体原理详述如下。

1) 利用初始输入样本矩阵Z,并依据2.2节内容,求出第1隐含层的输出矩阵H(1)以及重构矩阵ξ(1)。

2) 将H(1)视为第2层隐含层的输入,求得该层的输出矩阵H(2)以及重构矩阵ξ(2)。

3) 以次类推,以第e层隐含层的输出矩阵H(e)作为输入,求得e+1层的隐含层输出矩阵H(e+1)和重构矩阵ξ(e+1)。

4) 初始输入样本Z经τ个隐含层实现特征映射和抽象表达后得到Zτ,采用核函数对其进行映射,且核函数以内积的方式无需设置节点个数。此时,定义核矩阵为[21-22]:

(23)

式中:zp、zq分别为第p、第q个输入样本向量,且整数p、q∈[1,K];
K(zp,zq)为核函数,通常选取径向基核,即:

K(zp,zq)=exp(-γ‖zp,zq‖2)

(24)

式中:γ为核参数,且为正数;
‖zp,zq‖为两输入样本向量的欧式范数。

5) 在核函数的基础上,结合2.1节所述的ELM理论,得到DK-ELM的输出和最后一个输出权重β的数学表达式为:

(25)

本文提出一种小波变换样本熵和DK-ELM相结合的方法,从多种类型的电压暂降扰动中辨识其电压暂降源类型,其具体识别流程如图4所示。

图4 电压暂降源辨识流程图Fig.4 Flow chart of voltage sag source identification

1) 初始样本生成。基于PSCAD/EMTDC仿真环境,建立电压暂降仿真模型,改变模型参数,仿真由单相短路C1、两相短路C2、三相短路C3、两相相间短路C4、变压器的容量投切C5、感应电动机启动C6引起的电压暂降,得到对应的初始样本集为:{UC1,UC2,UC3,UC4,UC5,UC6}。针对实际电力系统,安装的电能质量监测装置将会实时采集电压暂降数据,在监测平台可直接得到实测电压暂降数据,进而获得初始样本。

2) 数据预处理。在MATLAB命令窗口中,采用V2=V1/max(V1)的方式对初始样本集合的数据进行归一化处理,其中V1为原序列,V2为归一化后的序列;
并在此基础上直接调用smooth函数实现数据的平滑处理,窗宽为15。

3) 提取特征。采用db4小波对预处理后的初始样本集合中的每个样本进行分解处理,并对所得的8个系数计算样本熵,构成24维特征向量F,至此,由特征向量F构成的新样本集可表示为:{ZC1,ZC2,ZC3,ZC4,ZC5,ZC6}。

针对实际电力系统中电压暂降源的辨识问题,将以大量的实测数据代替仿真数据。根据图4所示流程图编写完整的电压暂降源辨识程序,并对其DK-ELM辨识模型进行多次训练和调试,得到适用于实测数据的最优电压暂降源辨识模型,最终形成输入为电压暂降实测数据、输出为辨识结果的完整电压暂降源辨识程序。将该程序植入到电能质量监测与分析平台中,当监测点检测并采集到某一电压暂降实测数据时,电能质量监测与分析平台会自动将其作为输入,而后输出对应的辨识结果,并将其显示在可视化界面上,从而实现在实际电力系统中的应用。但受条件所限,本文仅考虑了通过仿真建模来产生仿真数据并实现电压暂降源辨识的情况,同理,实测数据的辨识流程与之类似。

4.1 初始数据样本生成

为对所提方法进行验证,基于文献[11],在PSCAD/EMTDC中建立了如图5所示的电压暂降仿真模型。其中,电源电压为13.8kV、频率为50Hz,IM为鼠笼型异步电机,各变压器的变比和连接方式、线路参数如图所示,仅T1考虑了铁芯的饱和特性。

图5 电压暂降仿真模型Fig.5 Simulation model of voltage sag

通过设定不同模型参数,即改变短路故障类型、持续时间和短路阻抗,改变变压器的额定容量和投切时间,改变电动机的额定电压和电流,分别得到与C1、C2、C3、C4、C5、C6引起的电压暂降对应的初始数据样本各150组,共计900组。

每个初始数据样本经预处理后,采用小波变换提取其样本熵特征,并得到24维的特征向量。以特征向量作为DK-ELM模型的输入,采用0-1(二进制编码)设置对应的标签作为输出,从而构成每类电压暂降源样本,以约2∶1的比例随机划分为训练样本和测试样本,划分结果及输出标签如表1所示。

表1 数据样本分布情况Tab.1 Data sample distribution

4.2 模型性能评价指标

为对所提方法的性能作出评价,在混淆矩阵的基础上,引出准确率、精确率、召回率等指标,并参照二分类混淆矩阵给出指标的定义,如表2所示。其中,TP表示正类中正确预测的样本数;
TN表示负类中正确预测的样本数;
FP表示负类中预测为正类的样本数;
FN表示正类中预测为负类的样本数。

表2 分类情况的混淆矩阵Tab.2 Confusion matrix of binary classification

准确率PAccuracy:被正确辨识的样本占总测试样本的比重。

(26)

精确率PPrecision:预测为正类的所有样本中,实际为正类的样本所占比重。

(27)

召回率PRecall:实际为正类的所有样本中,预测为正类的样本所占比重。

(28)

值得注意的是,以上指标取值越接近于1,则表明模型性能越好。将上述三个指标扩展至适用于多分类的情况,即可用于评价所提方法的性能。

4.3 仿真结果及对比分析

采用db4小波对电压暂降波形进行7层分解,并对其分解系数提取样本熵特征,进而构成特征向量F作为DK-ELM的输入向量。经过反复训练和测试,并调整相关参数,建立了具有两层ELM-AE网络结构(隐含层节点个数分别为150、250)的DK-ELM模型,激活函数为sigmoid,核参数和正则化系数分别为0.000 015、100,核函数为径向基核。

将测试样本输入到已建好的DK-ELM电压暂降源辨识模型中,得到混淆矩阵如图6(a)所示。同时,为体现所提方法的优越性,在数据样本不变的情况下,与文献[23]进行对比分析,其混淆矩阵如图6(b)所示。

图6 混淆矩阵结果Fig.6 Confusion matrix results

由图6(a)可知,仅有1个C3类的样本被辨识为C2类,其余电压暂降源类别都被正确辨识;
而由图6(b)可知,C1、C2和C3类均存在错误辨识的情况,共计9个样本被错误辨识,其他类别均被准确辨识。

根据图6所示的结果并结合4.2节内容,计算得到各性能评价指标,如表3所示。

表3 模型性能评价指标计算结果Tab.3 Calculation results of model performance evaluation indexs

由表3可知,在准确率上,本文方法达到了0.996 7,较文献[23] 所提方法的0.970 0更高,表明本文方法对电压暂降源的辨识性能更好;
在精确率上,本文方法仅在C2类上不为1,但也达到了0.980 0,而文献[23]所提方法在C1、C2和C3类上都低于0.981 8,且都比本文所提方法的对应值低;
在召回率上,本文方法仅在C3类上不为1,但也达到了0.978 7,而文献[23]所提方法在C1、C2和C3类上最高为0.957 4,且都低于本文所提方法的对应值。综上,精确率和召回率的分析结果表明,本文所提方法对每类暂降源的辨识性能良好,且均优于文献[23]所提方法。

4.4 考虑噪声影响

在实际电网中,电能质量监测装置所采集到的电压暂降数据通常存在一定的噪声,为使所提方法能适用于实际情况,对仿真数据添加不同信噪比(signal noise ratio, SNR)的高斯白噪声,以验证所提方法的抗噪声性能(信噪比越小,噪声就越大)。

对添加不同信噪比的数据样本进行测试,计算其准确率的大小,如表4所示。

表4 不同信噪比下的辨识结果Tab.4 Identification results under different SNRs

由表4可知,在不同信噪比情况下,所提方法的准确率会随着信噪比的减小而降低,且在信噪比为30dB的情况下,准确率达到了0.940 0,仍可实现电压暂降源的准确辨识。因此,所提方法具有良好的抗噪声性能。

本文提出了一种基于小波变换样本熵和深度核极限学习机的电压暂降源辨识方法,并通过仿真分析,验证了所提方法的正确性和有效性。

1) 提出了基于小波变换样本熵的特征提取方法,对电压暂降信号进行小波变换,进而计算小波系数的样本熵,构成特征向量。该方法可实现快速分解和获得更多对电压暂降源辨识有用的信息,同时也减小了数据量,提高了计算效率。

2) 将机器学习引入到电压暂降源辨识领域中,通过DK-ELM模型的辨识,得到无噪声和信噪比30 dB情况下,其辨识准确率分别为0.996 7、0.940 0,相较于其他方法,本文方法具有更好的辨识性能。

3) 以最为典型的电压暂降源为基础,提出了一种可行的电压暂降源辨识方法,而如何将所提方法用于其他类型的电压暂降源辨识还有待进一步研究。

猜你喜欢 学习机特征向量波形 正面碰撞车身加速度对乘员腿部损伤的影响汽车零部件(2022年7期)2022-08-03基于时域波形掩护的间歇采样干扰对抗研究电子技术与软件工程(2022年6期)2022-07-07警惕平板学习机骗局保健与生活(2022年10期)2022-05-06极化正交编码波形雷达试验系统.雷达学报(2022年2期)2022-04-30“雷达波形设计与运用专刊”编者按.雷达学报(2022年2期)2022-04-30克罗内克积的特征向量保定学院学报(2022年2期)2022-04-07高中数学特征值和特征向量解题策略中学生理科应试(2021年11期)2021-12-09“机”关文萃报·周五版(2021年30期)2021-09-05三个高阶微分方程的解法研究数学学习与研究(2018年15期)2018-11-12从学习机到上网本微电脑世界(2009年3期)2009-04-03

推荐访问:学习机 辨识 样本