<strike id="a6swh"></strike>

<video id="a6swh"><input id="a6swh"></input></video>
<th id="a6swh"><video id="a6swh"><span id="a6swh"></span></video></th>
  • <strike id="a6swh"><video id="a6swh"></video></strike>
  • <pre id="a6swh"></pre>

  • <del id="a6swh"></del>
    1. <strike id="a6swh"><video id="a6swh"></video></strike><big id="a6swh"><em id="a6swh"></em></big>
      1. <strike id="a6swh"><sup id="a6swh"></sup></strike>

        1. <strike id="a6swh"></strike>
          <tr id="a6swh"></tr>
          <th id="a6swh"></th>
        2. <th id="a6swh"></th>
          <big id="a6swh"><em id="a6swh"></em></big>

              <th id="a6swh"></th>

              啊用点力对就是那里视频,啊…啊学长你干嘛我在写作业作文,免费看韩国电影的app,欧美3p大片在线观看完整版

              6.2 現代電力配電智能控制當前位置: 網站首頁 > 6.2 現代電力配電智能控制
              《基于數據挖掘的配電網故障風險預警》

              劉科研1,吳心忠2,石琛2,賈東梨1

              (1.中國電力科學研究院,北京  1001922.北京交通大學 電氣工程學院,北京  100044


              摘要:為了提高配電網風險預警的準確性,提出了基于數據挖掘的配電網故障關聯因素分析與風險預警的方法。通過數據清洗、數據變換、數據集成和離群樣本剔除,歸納配電網四大類共28個故障特征;采用改進的 Relief-Wrapper算法進行故障關聯因素分析,剔除了 6個冗余特征,形成了由22個故障特征組成的最優故障 特征子集;提出了兼顧故障發生頻率和失電負荷比例的配電網故障風險指標和風險等級劃分方法,采用基于徑向基函數的支持向量機(SVM方法和最優故障特征子集進行風險預警—對某市120條饋線配電網進行了 風險預警算例分析,結果驗證了所提方法的有效性。

              關鍵詞:配電網;數據挖掘;故障關聯因素;最優故障特征子集;風險預警;支持向量機;風險指標

               

              0 引言

              據統計,用戶停電事故中80%以上都為配電網發生故障導致的,因此,對配電網運行過程中存在的故障風險進行有效的預警,及時采取風險防控措施,對保障供電安全性和可靠性顯得尤為重要。

              停電事故風險預警技術已較多地應用在輸電網 中,主要基于潮流、電壓、頻率等狀態監測數據,并對 輸電網的運行風險進行評估并預警,但是這些成果很難應用到配電網中。配電網的網絡拓撲復雜, 設備種類眾多、分布相對分散,設備運行狀態容易受 到外部因素的影響,故障發生的隨機性強,因此難 以通過分析機理實現風險預警。

              文獻在配電網實時風險評估中,考慮了設 備實時故障率,并對故障停電影響后果中的各指標 進行量化。文獻以用戶為中心進行風險評估, 近似采用穩態的失效率計算故障率,但僅能用于評 估短期的運行風險狀況。文獻通過分析突發事 件對設備故障率的影響建立評估模型,考慮孤島運 行情況,并給出了風險預警等級和劃分方法。文獻以最小過熱區域為單位計算停運概率,同時考慮故障恢復重構,計算不同災害下的停電指標,縮短了計算時間。傳統的配電網風險評估預警研究主要從故障率和故障影響后果人手,偏向于建立停電風 險指標,對停電風險關聯因素及其風險預警模型的 建立涉及較少。

              近年來,數據挖掘算法憑借計算速度快、泛化能力強等優點廣泛應用于電網研究和工程實際。數據挖掘的重要應用之一就是預測性分析,數據挖掘算法能夠從大規模海量數據中挖掘數據間的潛在規則。文獻在電力系統暫態穩定評估中綜合 利用不同參數訓練的支持向量機SVM ( Support Vector Machine),減少了“誤判穩定”樣本的個數。 文獻利用因子分析法提取風險指標中的共有因素,采用SVM構建故障風險模型,實現了電網的 故障風險評估。文獻在分析發電機的進相能 力時,建立了基于相關向量機(RVM)的模型,提高了模型精度。

              因此,針對配電網故障停電風險,本文提出一種基于數據挖掘的配電網風險預警方法。基于改進 Relief-Wrapper算法分析配電網故障關聯因素,篩選 22個與故障強相關的故障特征變量構成最優故障 特征子集;提出一種基于徑向基核函數RBF(Radical Basic Function) SVM方法和最優故障特征子集的配電網風險評估指標和風險等級劃分方法;以某地 級市配電網120條饋線作為算例進行測試,驗證了所提風險預警模型和方法的有效性、準確性,對工程 實際應用有一定的指導意義。


              1 配電網原始故障數據的預處理

              本文研究是針對某地級市配電網120條饋線展開的。通過對該市配電網信息管理系統進行調研, 從營銷業務管理系統、企業資源計劃(ERP)系統、配 電自動化系統、用電信息采集系統、配電線路在線監 測系統、生產管理系統、配電地理信息系統、智能公 用配變監測系統這8個信息子系統中,獲取了從 20141月至201561.5 a的饋線故障相關數據,并收集該區域對應時間段的溫度、降水等天氣數據。

              數據預處理包括數據清洗、數據變換、數據集成和離群樣本剔除4個步驟。

                     a. 數據清洗:包含數據空缺值處理、數據異常值處理、數據重復值處理。數據空缺值處理主要是對原始數據中記錄缺失和記錄中的某個缺失字段缺失 進行剔除或補充;數據異常值處理是根據原始數據 的特點,制定相應的規則對偏差過大的數據進行剔 除或替換;數據重復值處理是根據數據自身的特點,對重復的數據進行剔除。

              b. 數據變換:將原有的數據轉換為易于分析和 應用的形式,主要內容包含特征構造、數據分級及數據量化等,如量化位置信息、投運時間構建特征屬 性、天氣數據的分級分析等。以月降水M為例,據統 計該地級市的月降水量主要集中于59月,約占全年降水量的57%(其中6月降水量最高,7月次之,5月和89月降水量比較相近);34月的降水量次之,約占全年降水量的18.9%;10月至次年2月的降水量較少,其降水量和僅約占全年降水量的24.1%。故可將月降水量分成3個等級。同樣地,月雷暴曰 數和月大風日數也分成3個等級。從數據分析的結 果可知,饋線的故障情況與溫度、降雨、大風和雷擊 等環境條件密切相關,且在一年四季中是隨時間而 變化的。

              c. 數據集成:進行數據統計,將數據合并到某個 統一的數據庫中,饋線故障風險預警所需數據來自于不同的配電信息管理系統,因此需要對原始數據進行統計分析與合并。

              d. 離群樣本剔除:經過前述預處理的原始數據中還可能包含異常的樣本,與同一數據集中的絕大 部分數據差異很大,這種數據稱之為離群樣本。可采用基于統計的、基于鄰近值或基于聚類的方法,加 以識別和剔除。限于篇幅,本文不再展開。

              由于各特征變童的影響程度與其取值范圍有密 切關系,所以所有變量都預先按式(1)進行歸一化處理。

               

               其中,xmaxxmin分別為變量取值的最大值和最小值。

              通過數據預處理可將配電網故障特征分成故障 因素、外部因素、自身因素和運行因素4類共28個,如表1所示。


              2 配電網故障關聯因素分析

              為了提高配電網風險預警的效率和準確性,必 須先從海量數據和眾多故障特征中識別和提取與配 電網故障密切相關的故障特征,剔除相關性不強和 冗余的特征。Relief算法是一種得到廣泛應用的特 征選擇算法,由KimRendel首先提出,該算法的 要點是根據特征對近距離樣本的區分能力來評價特 征的重要性。其基本思想是:對所有特征各賦予一個權值,以表征特征與每類的相關程度,然后利用假設間隔的概念對權值進行迭代計算,最后根據權 重的大小確定所選擇的特征。


              1配電網故障特征變量分類

               


              Relief算法的步驟如下:對每個特征賦予權值初值Wj=0j=12,…,N);選擇樣本x i(i =1,2,…,tt為從樣本集中抽取的樣本數),從同類樣本集中找到樣本x i的最近鄰樣本Hx i),從異類樣本集中找到x i的最近鄰樣本特征Mx i)。Wj的更新方式如下:

               

              其中,x i為從數據集隨機選擇的一個樣本;Wj為特征j的權值;Hx i)為與x i同類的最近鄰樣本;Mx i)為與x i非同類的最近鄰樣本;diff(?)為距離函數。

              Relief算法可以給出每個特征的權重系數,但不 能識別冗余特征。因此本文提出一種改進的Relief- Wrapper算法,采用Pearson相關系數的絕對值衡量2個特征fifj,的相關性ρij

               

               其中,cov(fifj)為fifj的協方差;σfiσfj分別為fifj的方差。

              單個特征fi與已選特征集合s之間的相關性指 標可以用fis中任一特征之間相關系數絕對值的 最大值描述:

               

              綜合考慮特征的重要性與冗余性,定義如下的 特征評價指標:

               

              其中,Wfi [01]為歸一化后的單個特征fiRelief權重,該值越大,表示該特征與配電網故障之間的關系越密切;ρfi,[01]為特征fi與已選特征集合s之間的相關性指標,ρfi,的值越大,表示特征fi與已選特征集s中的特征越冗余;R為相關性指標所占的懲罰因子,當R=0時,式(4)退化為不考慮冗余因素的原始Relief權重計算公式,當R的值較大時,相當于加重了由相關系數描述的冗余性的懲罰力度,使冗余度越小的特征綜合權重越大,越容易被選中。


              3 基于RBF-SVM的配電網風險預警

              SVM是數據挖掘中用于分類識別的常用技術,本文采用的是基于RBFSVM,其非線性映射能力能將低維空間的非線性問題映射到高維空間,增強識別對象的線性可分性。基于RBFSVM算法的 詳細步驟參見文獻,本文不再贅述。

              配電網的風險不但與停電的頻繁程度有關,還與每次停電事故中的失電范圍有關。頻繁程度可以用停電次數表示,它是一個基于統計的概率量; 而失電范圍可以用每次停電的失負荷總量表示,它 表征了此次事故的嚴重程度。實際工作中每個饋線 分區核定的報裝負荷總量不一樣,給本文的故障風險評估和風險等級劃分帶來一定的困難。為此本文 提出一種配電網風險評估指標和風險等級劃分方 法。以每一個饋線分區每個月的運行數據和狀態為統計分析對象和風險預警對象,記SiN為第i個饋線分區的核裝容量,Sij為統計對象月中第i個饋線分區第j次停電事故中的失負荷總量,nf為當月停電事故總數,則該饋線分區當月的失電負荷比例累積 值Ci為:

               

               根據以上指標將配電網饋線風險劃分成3個等級,如表2所示。綜合考慮nfCi 這2個指標,取其中最嚴重的風險等級,如在1次停電中失電負荷比例超過50%,則當月的風險等級就應該定為2級。


              2  配電網風險等級劃分

               

               

              本文采用預警準確率及Kappa統計指標作為饋 線故障預測模型評估指標。Kappa統計指標一般用 于評判預測模型的分類預測結果與隨機分類的差異度,通過誤差矩陣的值計算得到。誤差矩陣是一個ns×ns階矩陣(ns陣為分類數),矩陣的行代表分類點,列代表預測點,對角線部分指某類測試樣本與預測 類別完全一致的數量。文獻給出了Kappa統計指標計算方法:

               

                     其中,KKappa統計指標;r為誤差矩陣的行數;xii為第i行第i列(主對角線)上的值;xi+x+i分別為第i行的和與第i列的和;Ns為測試樣本總數。K∈[0,1]K值越大表明準確率越高。

              本文的研究思路和風險預警流程如圖1所示。

               

               風險預警流程圖

              4 算例分析

              4.1 故障關聯因素分析

              以某地級市配電網120條饋線1.5 a的運行數據為基礎,以從8個配電網管理信息子系統中采集 的數據為分析對象,以每一條饋線每個月的運行數據為一個統計單位,采用前述的方法進行數據清洗、數據變換、數據集成和離群樣本剔除,歸納得到如表1所示的428個故障特征;采用前述改進的 Relief-Wrapper算法進行故障關聯因素分析,形成由22個故障特征組成的最優故障特征子集,剔除6個冗余特征,如表3所示。


              預測方法結果對比

               


              采用Relief算法可以計算得到所有特征值的權重大小,如圖2所示。本文作為特征篩選閾值的設定遵循統計學計算的經驗,即將這些權重值歸一化為[0,1]的值。基于統計的置信區間的概念,通常95%的置信水平是大概率事件,因此,可以假設特征的權重值大小表示該特征所包含整個特征集中信息量的多少,那么,如果信息的累積比例達到95%,則可以認為這些特征包含了全體特征集合的大部分信息量,同時,這些特征可以被認為是最重要的。根據這一假設,門檻值τ的設定規則如下:歸一化權重值已經按照降序進行排序并累加計算,當計算停止時,該累積值達到95%;上述假設中所提到的通過Relief算法計算的權重值表示特征的重要程度,因此,當累加計算停止時,所對應的歸一化的權重值就可以設定為特征篩選閾值τ。圖2中的虛線即為通過計算得到的閾值τ,因此,這里被篩選剔除的關聯度較低的特征為{f18,f19f20f26f27, f28}。



              圖2  特征權重值


                  從特征選擇的結果來看,與饋線故障直接相關的故障特征全部得以保留,它們代表了故障的時間特征、地域特征、故障自相關因素等,它們與故障強相關且相互獨立。而在自身和運行因素2類故障特征中均存在一些冗余因素得以有效的剔除,說明了本文所提方法的選擇性和有效性。從關聯因素分析結果還可看出,饋線的故障情況不僅與饋線長度和負荷情況有關,還與溫度、降雨、大風和雷擊等環境因素密切相關。所以本文旨在提出一種基于大數據的配電網故障關聯因素分析和故障預警的模型與方法,針對不同地區的配電網必須從當地配電系統中獲取運行與故障數據,所得到的故障關聯因素也可能是不一樣的。


              4.2 風險預警
                    由于不同饋線的故障風險是隨時間變化的,考慮到這種時變因素,本文選取120條饋線的2014年4月至2015年3月的一整年數據作為訓練樣本數據,2015年4月的數據作為測試樣本數據,2015年5、6月的樣本作為預測樣本。其中,訓練樣本用于訓練獲取模型,測試樣本用于模型的優化,預測樣本用于驗證模型的實際預警效果。
                    各風險等級的饋線樣本數量如表4所示。


              表4  各風險等級樣本數量 


                      采用基于RBF的SVM方法和22個最優故障特征子集,對預測樣本中120條饋線在2015年5,6月的月風險等級進行預警,具體的饋線預警結果如表5所示,表中月預測準確率為當月準確預測的樣本數與當月饋線樣本總數的比值。

              表5  配電網故障風險等級預警結果


                    由表5可見,每個月的預警準確率都在90%以上,2個月的平均預警準確率為93.75%,說明本文提取的故障特征子集和預警方法具有較高的準確性和實用性;預警失誤的樣本最多只偏差一個等級,不會跨越2個等級,說明本文方法的魯棒性較強;5月份等級2和3的樣本預測精度較低,是因為這2個等級的原始樣本太少。在原始樣本中,風險等級1的樣本占74%,等級2和3的樣本分別只占20%和 6%,這也符合配電網故障的實際情況。若能在訓練樣本中增加高風險等級的樣本數量,還能進一步提 高預警的準確率。由于各特征變量的時變性,導致配電網的風險也是隨時間變化的,而本文提出的方法可以很好地適應這種時變特征,為風險防控提供及時的技術支持。
                    為了驗證本文采用的基于KBF的SVM進行風險預警的優越性,還與人工神經網絡(ANN)、C4.5決策樹和基于線性核函數的SVM這3種常用的預測方法進行了對比,其準確率和Kappa指標如表6所示。
                    由表6可見,本文采用的基于RBF的SVM預警方法,不論是在預警準確率還是Kappa統計指標上,都優于其他3種方法。

              6  預測方法結果對比


              結論

              a. 本文基于數據挖掘的方法以某地級市配電網120條饋線1.5 a的數據為研究對象,對配電網故障關聯因素分析和風險預警的模型和方法進行了研究;提出了基于改進Relief-Wrapper算法的配電網故障關聯因素分析方法,提取了22個與故障強相關的故障特征構成最優故障特征子集,提高了風險預警的效率和準確性。

              b. 提出了兼顧故障發生頻率和失電負荷比例的配電網故障風險指標和風險等級劃分方法,采用基于RBFSVM方法和最優故障特征子集進行風險預警。對某地級市120條饋線進行了風險預警算例分析,驗證了本文所提風險預警模型和方法的有效性和正確性,為后續配電網在線風險防控提供了理論依據。

              c. 建議加強配電網信息管理系統的互聯與融合,加強配電網海量數據的挖掘和應用力度,進一步提高配電網的精益化管理水平,降低故障停電風險。

              d. 本文旨古提出一種基于大數據的配電網故障因素關聯分析和風險預警的模型和方法,由于配 電網故障具有地域性、環境敏感性和時變性,所以針對不同地區的配電網,必須從當地的配電系統中獲取第一手的運行與故障數據,識別的故障關聯因素也可能不盡相同。

              400-640-1300
              0513-80112000
              啊用点力对就是那里视频,啊…啊学长你干嘛我在写作业作文,免费看韩国电影的app,欧美3p大片在线观看完整版