開關電源廠家口若懸河講面向智能電網應用的電力大數據關鍵技術
大數據這個術語最早期的引用可追溯到Apache軟件基金會的開源項目Nutch。當時,大數據用來描述為更新網絡搜索索引需要同時進行批量處理或分析的大量數據集。
早在2008 年Nature就出版了專刊“Big Data”,從網絡經濟學、超級計算、互聯網技術、生物醫藥、環境科學等多個方面介紹了海量數據帶來的挑戰;2011年Science推出數據處理的?癉ealing With Data”,深入討論了數據洪流(datadeluge,DD)所帶來的挑戰,并指出如果能夠更有效地組織和利用這些海量數據,人們將得到更多的機會發揮科學技術對推動社會發展的巨大作用;2012年奧巴馬宣布美國政府投資2億美元啟動“大數據研究和發展計劃”,將大數據比喻為“未來的新石油”,將對大數據的研究上升為國家意志,掀起了世界各國大數據的研究熱潮。
大數據的定義,業界雖然有一些共識,但是并未有統一的定義。麥肯錫認為“大數據是指其大小超出典型數據軟件抓取、儲存、管理和分析范圍的數據集合”;Gartner認為“大數據是需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力的海量、高增長率和多樣化的信息資產”。
在對大數據的定義中,比較有代表性的定義是3V定義,即規模性(Volume),多樣性(Variety)和高速性(Velocity),規模性是指數據量龐大,數據洪流已經從GB、TB級上升到PB、EB、ZB級;多樣性是指數據類型繁多,并且包含結構化、半結構化和非結構化的數據;高速性則是指數據以數據流的形態快速、動態的產生,數據處理的速度也必須達到高速實時處理。
另外大數據第4V的討論并沒有取得一致的結論,國際數據公司(international data corporation, IDC)認為大數據應該具有價值性(Value),且價值密度稀疏;IBM則認為大數據的第4V特性是真實性(Veracity)。大數據的這些特點決定了在大數據時代,傳統的數據處理技術必需有革命性的提升。
電力系統作為經濟發展和人類生活依賴的能量供給系統,也具有大數據的典型特征。電力系統是最復雜的人造系統之一,其具有地理位置分布廣泛、發電用電實時平衡、傳輸能量數量龐大、電能傳輸光速可達、通訊調度高度可靠、實時運行從不停止、重大故障瞬間擴大等特點,這些特點決定了電力系統運行時產生的數據數量龐大、增長快速、類型豐富,完全符合大數據的所有特征,是典型的大數據。
在智能電網深入推進的形勢下,電力系統的數字化、信息化、智能化不斷發展,帶來了更多的數據源,例如智能電表從數以億計的家庭和企業終端帶來的數據,電力設備狀態監測系統從數以萬計的發電機、變壓器、開關設備、架空線路、高壓電纜等設備中獲取的高速增長的監測數據,光伏和風電功率預測所需的大量的歷史運行數據、氣象觀測數據等。
因此在電力系統數據爆炸式增長的新形勢下,傳統的數據處理技術遇到瓶頸,不能滿足電力行業從海量數據中快速獲取知識與信息的分析需求,電力大數據技術的應用是電力行業信息化、智能化發展的必然要求。
中國電機工程學會信息化專委會在2013年3月發布了《中國電力大數據發展白皮書》,將2013 年定為“中國大數據元年”,掀起了電力大數據的研究熱潮。根據白皮書描述,電力大數據的特征可概括為3V和3E。3V為體量大(Volume)、速度快(Velocity)和類型多(Variety) ; 3E 為數據即能量(Energy) 、數據即交互(Exchange)和數據即共情(Empathy)。
其3V的描述和其他行業的描述比較接近,3E的描述具有典型的電力行業特征,體現了大數據在電力系統應用中的巨大價值。數據即能量簡而言之,就是指通過大數據分析達到節能的目的,電力大數據應用的過程,就是電力數據能量釋放的過程;數據即交互是指電力大數據與國民經濟其他領域數據進行交互融合,才能發揮其更大價值;數據即共情是指電力大數據緊密聯系千家萬戶、廠礦企業,只有情系用電客戶,滿足客戶需求,電力企業方能以數據取勝。
電力大數據貫穿發、輸、變、配、用等電力生產及管理的各個環節,是能源變革中電力工業技術革新的必然過程,不僅是技術上的進步,更是涉及電力系統管理體制、發展理念和技術路線等方面的重大變革,是下一代電力系統在大數據時代下價值形態的躍升。對建設堅強智能電網而言,亟需開展大數據相關技術的研究,為電力大數據時代的到來奠定理論基礎和技術積累。
1 智能電網、云計算和大數據的關系
1.1 智能電網與大數據的關系
智能電網就是將信息技術、計算機技術、通信技術和原有輸、配電基礎設施高度集成而形成的新型電網,具有提高能源效率、提高供電安全性、減少環境影響、提高供電可靠性、減少輸電網電能損耗等優點。
智能電網的理念是通過獲取更多的用戶如何用電、怎樣用電的信息,來優化電的生產、分配及消耗,利用現代網絡、通信和信息技術進行信息海量交互,來實現電網設備間信息交換,并自動完成信息采集、測量、控制、保護、計量和監測等基本功能,可根據需要支持電網實時自動化控制、智能調節、在線分析決策和協同互動等高級功能,因此相關研究者指出:可以抽象的認為,智能電網就是大數據這個概念在電力行業中的應用。
1.2 大數據與云計算的關系
根據美國國家標準與技術研究院的定義,云計算是一種利用互聯網實現隨時、隨地、按需、便捷地訪問共享資源池(如計算設施、應用程序、存儲設備等)的計算模式。
從技術上看,大數據根植于云計算,云計算的數據存儲、管理與分析方面的技術是大數據技術的基礎。利用云計算強大的計算能力,可以更加迅速地處理大數據,并更方便地提供服務;通過大數據的業務需求,可以為云計算的發展找到更多更好的實際應用。
云計算使大數據應用成為可能,但是沒有大數據的信息沉淀,云計算的功能將得不到完全發揮,所以從整體上看,大數據與云計算是相輔相成的。
云計算和大數據的側重點不同,因此也有較大的差別。大數據關注重心在于數據背后的信息沉淀與業務分析,因此其推動力量來源于擁有大數據的企業和軟件廠商;云計算關注重心在于計算能力,偏重于技術解決方案,因此其推動力量來自于計算資源和存儲資源的生產廠商。
云計算技術的發展早于大數據技術的發展,但是大數據的業務需求又為云計算技術的發展帶來新的機遇,一方面促進了云計算技術向更加貼近用戶需求的方向發展,另一方面帶來了更高處理速度、更大存儲容量的要求。
1.3 智能電網、云計算、大數據的相互關系
云計算能夠整合智能電網系統內部計算處理和存儲資源,提高電網處理和交互能力,成為電網強有力的技術組成;大數據技術立足于業務服務需求,根植于云計算,以云計算技術為基礎;智能電網可以抽象的認為是大數據這個概念在電力中的應用,所以三者是彼此交互的關系。
智能電網、云計算、大數據三者之間的關系,從更加深層次來講,是電力系統發展到不同階段的產物,具有代紀傳承的特點。
智能電網是信息技術、計算機技術、人工智能技術等在傳統電網上應用沉淀的結果,滿足電網信息化、智能化、清潔化等高層次的運營和管理需求,既是對傳統電網的繼承,也是對傳統電網的發揚,所以其發展必然與新技術同步。
來自于計算機和信息技術領域最前沿的云計算技術和大數據技術,正是其發展階段技術層面和應用層面兩個具有劃時代意義的新技術。云計算技術中的分布式存儲技術和并行計算技術,滿足了電網海量數據的存儲和計算需求,因此云計算技術推出不久,電力云的概念就提出來,云計算技術在電力系統中的應用也逐漸呈現出百花齊放的態勢,推動了智能電網的發展。
大數據技術既是傳統數據分析與挖掘技術的延續,也是數據量級增長到一定階段時知識挖掘與業務應用需求的必然產物,因此大數據技術的大部分應用都以云計算的關鍵技術或者與云計算類似的分布式存儲和處理技術為基礎。電力大數據技術的發展從某種意義上講,可以看成是云計算技術在智能電網中,高級業務需求的實現過程。
2 電力大數據平臺的總體架構
Apache基金會開源技術通用的大數據平臺整體架構具有較好的通用性,適用于電力企業大數據的規劃,其主要思想是利用基于Hadoop文件系統(Hadoopdistributed file system,HDFS)的分布式文件處理系統作為大數據的存儲框架,利用基于MapReduce的分布式計算技術作為大數據的處理框架。
以分布式文件處理技術為基礎,使PB、ZB級的數據存儲成為可能;以分布式計算技術為基礎,使得PB、ZB級數據的查詢分析成為可能。另外該框架中還包含商業智能應用、傳統的數據倉庫、大數據訪問框架、大數據調度框架、網絡層、操作系統、服務器、備份和恢復、數據管理等模塊。
大數據存儲框架和大數據處理框架通常構建在通用的服務器、操作系統或者虛擬機上,使得該架構所需的硬件具有低成本和高擴展性的特點,標準的普通服務器或者PC機即可成為基于該架構的終端構成單元。
大數據存儲框架和大數據處理框架之上是通過網絡層連接的大數據訪問框架,該訪問框架包含并行計算機編程語言Pig、數據倉庫工具Hive、開源數據傳遞工具Sqoop 等子模塊。
大數據調度框架包含基于列存儲的開源非關系型數據庫Hbase、數據序列化格式與傳輸工具Avro、日志收集系統Flume、分布式鎖設施ZooKeeper等模塊。
大數據調度框架實現了對大數據的組織與調度,為數據分析提供了必要條件。在大數據調度框架之上是企業級商業智能應用系統,可以開展查詢、分析、統計、報表等高級應用。大數據的管理、安全和備份恢復框架幫助進行大數據的治理和保護。
該框架幾乎涵蓋了大數據技術的所有環節,值得指出的是,通過該訪問框架不僅可以實現對分布式文件存儲系統的訪問,而且通過大數據連接器和開源數據傳遞工具Sqoop可以實現對傳統數據倉庫的訪問。
大數據的處理流程可以定義為在合適工具的輔助下,對廣泛異構的數據源進行抽取和集成,按照統一的標準對結果進行存儲,利用恰當的數據分析技術對存儲的數據進行分析,達到從中提取出有價值的知識的目的,并用合適的方式將結果展現給終端用戶。
對電力企業來講,電力大數據的基本處理流程與傳統數據處理流程并無太大差異,主要區別在于:電力大數據需要處理大量、非結構的數據,所以在各個環節都可以采用MapReduce等方式進行并行處理。
電力系統是一種高維非線性的復雜系統,其內部的數據流包含電力流、信息流、業務流、故障流、氣象流等不同的數據流向。
對這些電力系統的子信息源而言,一方面可以單獨應用大數據技術,提升其產業價值,例如電力設備在線監測系統本身就是一個大數據系統,另一方面可以融合不同的子信息源,在更高的層面上構件大數據平臺,例如融合電能計量系統、SCADA系統、MIS系統、負荷控制系統,可以構建基于大數據平臺的網損分析系統,實現網損的自動統計與分析。
基于該網損分析大數據平臺,還可開展基于自動網損統計的用戶竊電行為挖掘,實現更深層次的應用。
3 電力大數據關鍵技術
3.1 電力大數據的集成管理技術
電力企業數據集成管理技術是合并來自2個或者多個應用系統的數據,創建一個具有更多功能的企業應用的過程。從集成的角度來說,就是把不同來源、格式、特點、性質的數據在邏輯上或者存儲介質上有機地集中,為系統存儲一系列面向主題的、集成的、相對穩定的、反映歷史變化的數據集合,從而為系統提供全面的數據共享。電力企業集成管理技術就是為解決電力企業內部各系統間的數據冗余和信息孤島而產生的。
電力大數據的數據集成管理技術,包含關系型和非關系型數據庫技術、數據融合和集成技術、數據抽取技術、過濾技術和數據清洗等。大數據的一個重要特點就是多樣性,這就意味著數據來源極其廣泛,數據類型極為繁雜,這種復雜的數據環境給大數據的處理帶來極大的挑戰,要想處理大數據,首先必須對數據源的數據進行抽取和集成,從中提取出實體和關系,經過關聯和聚合之后采用統一的結構來存儲這些數據,在數據集成和提取時需要對數據進行清洗,保證數據質量及可靠性。
大數據存儲管理中一個重要的技術是NoSQL數據庫技術,它采用分布式數據存儲方式,去掉了關系型數據庫的關系型特性,數據存儲被簡化且更加靈活,具有良好的可擴展性,解決了海量數據的存儲難題。有代表性的NoSQL 數據庫技術有Google的BigTable和Amazon的Dynamo等。
3.2 電力大數據的數據分析技術
大數據技術的根本驅動力是將信號轉化為數據,將數據分析為信息,將信息提煉為知識,以知識促成決策和行動。借助電力大數據的分析技術可以從電力系統的海量數據中找出潛在的模態與規律,為決策人員提供決策支持。
麥肯錫認為可用于大數據分析的關鍵技術源于統計學和計算機科學等學科,包含關聯分析、機器學習、數據挖掘、模式識別、神經網絡、時間序列預測模型、遺傳算法等多種不同的方法。
大數據研究不同于傳統的邏輯推理研究,是對巨大數量的數據做統計性的搜索、分類、比較、聚類等的分析和歸納,因此繼承了統計科學的一些特點,如統計學關注的數據相關性或稱關聯性,所謂“相關性”是指2個或2個以上變量的取值之間存在某種規律性[7]!跋嚓P分析”的目的是找出數據集里隱藏的關系網,一般用支持度、可信度、興趣度等參數反映相關性。
牛津大學網絡學院教授維克多在他的著作《大數據時代》中指出:在大數據時代,相關關系分析法將大放異彩,通過找到一個良好現象的關聯物,相關關系分析可以捕獲現在和預測未來。大數據相關關系分析法,建立在海量樣本的基礎上,不采用隨機分析法這樣的捷徑,而采用分析所有數據的方法;大數據的簡單算法比小數據的復雜算法更有效,其結果更快、更準確而且不易受到干擾,因此他指出建立在相關關系分析法基礎上的預測是大數據的核心。
大數據這種不注重因果關系側重于相關關系的分析方法,帶來了科學研究思維方式的重大轉變,已故圖靈獎得主吉姆˙格雷提出的數據密集型科研“第四范式”,將大數據科研從前3 種范式(理論科學、計算科學、實驗科學)中分離出來,單獨作為一種科研范式,正是因為其研究方式不同于基于數學模型的傳統研究方式。
電力大數據分析技術,從根本上講,屬于傳統數據挖掘技術在海量數據挖掘下的新發展,但由于大數據海量、高速增長、多樣性的特點,并且不僅包含結構化數據,還含半結構化和非機構化數據,因此傳統的很多處理小數據的數據挖掘方法已經不再實用。
大數據環境下的數據挖掘與機器學習算法,可以從3個方面著手:1)從大數據的治理與抽樣、特征選擇的角度入手,將大數據小數據化;2)開展大數據下的聚類、分類算法研究,例如基于共軛度的最小二乘支持向量機(least squares support vector machine,LS-SVM)],隨機可擴展FuzzyC-Means (FCM)等;3)開展大數據的并行算法,將傳統的數據挖掘方法通過并行化,應用到大數據的知識挖掘中,例如基于MapReduce的機器學習與知識挖掘。
3.3 電力大數據的數據處理技術
電力大數據的數據處理技術包括分布式計算技術,內存計算技術,流處理技術等。分布式計算技術是為了解決大規模數據的分布式存儲與處理。內存計算技術是為了解決數據的高效讀取和處理在線的實時計算。流處理技術則是為了處理實時到達的、速度和規模不受控制的數據。
分布式計算是一種新的計算方式,研究如何將一個需要強大計算能力才能解決的問題分解為許多小的部分,然后再將這些部分分給多個計算機處理,最后把結果綜合起來得到最終結果。
分布式計算的一個典型代表是Google公司提出的MapReduce編程模型,該模型先將待處理的數據進行分塊,交給不同的Map任務區處理,并按鍵值存儲到本地硬盤,再用Reduce任務按照鍵值將結果匯總并輸出最終結果。分布式技術適用于電力系統信息采集領域的大規模分散數據源。
內存計算技術是將數據全部放在內層中進行操作的計算技術,該技術克服了對磁盤讀寫操作時的大量時間消耗,計算速度得到幾個數量級的大幅提升。內層計算技術伴隨著大數據浪潮的來臨和內存價格的下降得到快速的發展和廣泛的應用,EMC、甲骨文、SAT都推出了內存計算的解決方案,將客戶以前需要以天作為時間計算單位的業務降低為以秒作為時間計算單位,解決了大數據實時分析和知識挖掘的難題。
流處理的處理模型是將源源不斷的數據組視為流,當新的數據到來時就立即處理并返回結果,其基本理念是數據的價值會隨著時間的流逝而不斷減少,因此盡可能快地對最新的數據做出分析并給出結果,其應用場景主要有網頁點擊的實時統計、傳感器網絡、金融中的高頻交易等[8]。
隨著電力事業的發展,電力系統數據量不斷增長,對實時性的要求也越來越高,將數據流技術應用于電力系統可以為決策者提供即時依據,滿足實時在線分析需求。
3.4 電力大數據的數據展現技術
電力大數據的數據展現技術包括可視化技術、空間信息流展示技術、歷史流展示技術等。可視化技術、空間信息流展示技術、歷史流展示技術從3個不同的方面詮釋了電力大數據展現技術的豐富內涵。借助電力大數據的數據展現技術可幫助管理人員更直觀、準確地理解電力系統數據表達的意義,了解電力系統的運行狀態。
可視化技術廣泛應用于電網狀態的實時監控,顯著提高了電力系統的自動化水平。未來電力系統可視化還可結合復雜網絡中的相關理論在電網自動分層分區、自動布點等方面展開深入研究,發掘電網更深層次的規律和聯系。
空間信息流展示技術主要體現在電網參數與已有地理信息系統的結合上,包含變電站三維展示、虛擬現實等技術。將電力配電設備管理與地理信息系統緊密結合起來,有利于電網管理人員直觀地了解設備情況,從而為其決策提供最新的地理信息。在變電站工程設計中用空間信息流展示技術可以節約時間、資源、成本,為電力企業帶來巨大的效益。
歷史流展示技術體現在對電網歷史數據的管理與展示上。在電力系統中,深層次的應用分析往往以歷史數據為基礎。對生產現場的實時監測數據、電網的規劃數據和負荷預測數據,通過歷史流展示技術,可以繪制出數據的發展趨勢并預測出未來的數據走勢;通過歷史流回放展示技術,可以模擬歷史重大事件發生、演變,挖掘歷史事件潛在的知識與規律。
4 大數據在智能電網中的應用
電力大數據的應用場合涵蓋發、輸、變、配、用、調等電力行業的各個環節,在風電場選址、降低網損、風電并網、電網安全監測、大災難預警、電力企業精細化運營、電力設備狀態監測等領域有非常強的可實現性。
5 結論與展望
本文探討了大數據、云計算、智能電網三者之間的相互關系,并給出電力大數據的總體可執行框架,對電力企業大數據平臺的搭建具有參考價值。
本文闡述了電力大數據平臺中4個核心的關鍵技術,即集成管理技術、分析技術、處理技術、展現技術。大數據的集成管理技術應該考慮關系型和非關系型數據庫技術的綜合應用,并重點考慮NoSQL數據庫技術;大數據的分析技術應從大數據的治理與抽樣、大數據特征選擇、大數據小數據化、大數據的分類算法、大數據挖掘并行化等方面開展研究;大數據的處理技術應根據具體的應用需求考慮分布式計算、內存計算、流處理等技術;電力大數據的數據展現技術可考慮可視化技術、空間信息流展示技術、歷史流展示技術等。
大數據技術在商業領域已經獲得較為廣泛的應用并創造出巨大的商業價值,但是在電力系統中的應用才剛剛起步,因此結合大數據的技術優勢和電力系統的應用需求,發揮電力大數據的價值,將為智能電網的建設帶來新的發展契機。
電力企業應該牢牢抓住這個契機,從數據政策、人才培養、關鍵技術研發等層面,全面促成電力大數據技術的發展。
保定市四北電子有限公司具有卓越的產品性能、優良的品質、高可靠的電源設計,并提供定制開關電源服務,F已形成幾大系列產品:開關電源系列、逆變電源系列、充電電源系列、備用電源系列等產品。提供AC/DC、DC/DC、DC/AC基板式、模塊式、嵌入式等各種形式專用電源。
主要電源類別有:電力自動化設備專用電源;通訊領域專用電源;電力測試儀器專用電源;機車控制系統電源:高壓激光電源;浮充電電源;UPS電源;伺服式交流穩壓電源;ZDD系列20W∽3KW逆變電源。http://www.www.56436.cn
早在2008 年Nature就出版了專刊“Big Data”,從網絡經濟學、超級計算、互聯網技術、生物醫藥、環境科學等多個方面介紹了海量數據帶來的挑戰;2011年Science推出數據處理的?癉ealing With Data”,深入討論了數據洪流(datadeluge,DD)所帶來的挑戰,并指出如果能夠更有效地組織和利用這些海量數據,人們將得到更多的機會發揮科學技術對推動社會發展的巨大作用;2012年奧巴馬宣布美國政府投資2億美元啟動“大數據研究和發展計劃”,將大數據比喻為“未來的新石油”,將對大數據的研究上升為國家意志,掀起了世界各國大數據的研究熱潮。
大數據的定義,業界雖然有一些共識,但是并未有統一的定義。麥肯錫認為“大數據是指其大小超出典型數據軟件抓取、儲存、管理和分析范圍的數據集合”;Gartner認為“大數據是需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力的海量、高增長率和多樣化的信息資產”。
在對大數據的定義中,比較有代表性的定義是3V定義,即規模性(Volume),多樣性(Variety)和高速性(Velocity),規模性是指數據量龐大,數據洪流已經從GB、TB級上升到PB、EB、ZB級;多樣性是指數據類型繁多,并且包含結構化、半結構化和非結構化的數據;高速性則是指數據以數據流的形態快速、動態的產生,數據處理的速度也必須達到高速實時處理。
另外大數據第4V的討論并沒有取得一致的結論,國際數據公司(international data corporation, IDC)認為大數據應該具有價值性(Value),且價值密度稀疏;IBM則認為大數據的第4V特性是真實性(Veracity)。大數據的這些特點決定了在大數據時代,傳統的數據處理技術必需有革命性的提升。
電力系統作為經濟發展和人類生活依賴的能量供給系統,也具有大數據的典型特征。電力系統是最復雜的人造系統之一,其具有地理位置分布廣泛、發電用電實時平衡、傳輸能量數量龐大、電能傳輸光速可達、通訊調度高度可靠、實時運行從不停止、重大故障瞬間擴大等特點,這些特點決定了電力系統運行時產生的數據數量龐大、增長快速、類型豐富,完全符合大數據的所有特征,是典型的大數據。
在智能電網深入推進的形勢下,電力系統的數字化、信息化、智能化不斷發展,帶來了更多的數據源,例如智能電表從數以億計的家庭和企業終端帶來的數據,電力設備狀態監測系統從數以萬計的發電機、變壓器、開關設備、架空線路、高壓電纜等設備中獲取的高速增長的監測數據,光伏和風電功率預測所需的大量的歷史運行數據、氣象觀測數據等。
因此在電力系統數據爆炸式增長的新形勢下,傳統的數據處理技術遇到瓶頸,不能滿足電力行業從海量數據中快速獲取知識與信息的分析需求,電力大數據技術的應用是電力行業信息化、智能化發展的必然要求。
中國電機工程學會信息化專委會在2013年3月發布了《中國電力大數據發展白皮書》,將2013 年定為“中國大數據元年”,掀起了電力大數據的研究熱潮。根據白皮書描述,電力大數據的特征可概括為3V和3E。3V為體量大(Volume)、速度快(Velocity)和類型多(Variety) ; 3E 為數據即能量(Energy) 、數據即交互(Exchange)和數據即共情(Empathy)。
其3V的描述和其他行業的描述比較接近,3E的描述具有典型的電力行業特征,體現了大數據在電力系統應用中的巨大價值。數據即能量簡而言之,就是指通過大數據分析達到節能的目的,電力大數據應用的過程,就是電力數據能量釋放的過程;數據即交互是指電力大數據與國民經濟其他領域數據進行交互融合,才能發揮其更大價值;數據即共情是指電力大數據緊密聯系千家萬戶、廠礦企業,只有情系用電客戶,滿足客戶需求,電力企業方能以數據取勝。
電力大數據貫穿發、輸、變、配、用等電力生產及管理的各個環節,是能源變革中電力工業技術革新的必然過程,不僅是技術上的進步,更是涉及電力系統管理體制、發展理念和技術路線等方面的重大變革,是下一代電力系統在大數據時代下價值形態的躍升。對建設堅強智能電網而言,亟需開展大數據相關技術的研究,為電力大數據時代的到來奠定理論基礎和技術積累。
1 智能電網、云計算和大數據的關系
1.1 智能電網與大數據的關系
智能電網就是將信息技術、計算機技術、通信技術和原有輸、配電基礎設施高度集成而形成的新型電網,具有提高能源效率、提高供電安全性、減少環境影響、提高供電可靠性、減少輸電網電能損耗等優點。
智能電網的理念是通過獲取更多的用戶如何用電、怎樣用電的信息,來優化電的生產、分配及消耗,利用現代網絡、通信和信息技術進行信息海量交互,來實現電網設備間信息交換,并自動完成信息采集、測量、控制、保護、計量和監測等基本功能,可根據需要支持電網實時自動化控制、智能調節、在線分析決策和協同互動等高級功能,因此相關研究者指出:可以抽象的認為,智能電網就是大數據這個概念在電力行業中的應用。
1.2 大數據與云計算的關系
根據美國國家標準與技術研究院的定義,云計算是一種利用互聯網實現隨時、隨地、按需、便捷地訪問共享資源池(如計算設施、應用程序、存儲設備等)的計算模式。
從技術上看,大數據根植于云計算,云計算的數據存儲、管理與分析方面的技術是大數據技術的基礎。利用云計算強大的計算能力,可以更加迅速地處理大數據,并更方便地提供服務;通過大數據的業務需求,可以為云計算的發展找到更多更好的實際應用。
云計算使大數據應用成為可能,但是沒有大數據的信息沉淀,云計算的功能將得不到完全發揮,所以從整體上看,大數據與云計算是相輔相成的。
云計算和大數據的側重點不同,因此也有較大的差別。大數據關注重心在于數據背后的信息沉淀與業務分析,因此其推動力量來源于擁有大數據的企業和軟件廠商;云計算關注重心在于計算能力,偏重于技術解決方案,因此其推動力量來自于計算資源和存儲資源的生產廠商。
云計算技術的發展早于大數據技術的發展,但是大數據的業務需求又為云計算技術的發展帶來新的機遇,一方面促進了云計算技術向更加貼近用戶需求的方向發展,另一方面帶來了更高處理速度、更大存儲容量的要求。
1.3 智能電網、云計算、大數據的相互關系
云計算能夠整合智能電網系統內部計算處理和存儲資源,提高電網處理和交互能力,成為電網強有力的技術組成;大數據技術立足于業務服務需求,根植于云計算,以云計算技術為基礎;智能電網可以抽象的認為是大數據這個概念在電力中的應用,所以三者是彼此交互的關系。
智能電網、云計算、大數據三者之間的關系,從更加深層次來講,是電力系統發展到不同階段的產物,具有代紀傳承的特點。
智能電網是信息技術、計算機技術、人工智能技術等在傳統電網上應用沉淀的結果,滿足電網信息化、智能化、清潔化等高層次的運營和管理需求,既是對傳統電網的繼承,也是對傳統電網的發揚,所以其發展必然與新技術同步。
來自于計算機和信息技術領域最前沿的云計算技術和大數據技術,正是其發展階段技術層面和應用層面兩個具有劃時代意義的新技術。云計算技術中的分布式存儲技術和并行計算技術,滿足了電網海量數據的存儲和計算需求,因此云計算技術推出不久,電力云的概念就提出來,云計算技術在電力系統中的應用也逐漸呈現出百花齊放的態勢,推動了智能電網的發展。
大數據技術既是傳統數據分析與挖掘技術的延續,也是數據量級增長到一定階段時知識挖掘與業務應用需求的必然產物,因此大數據技術的大部分應用都以云計算的關鍵技術或者與云計算類似的分布式存儲和處理技術為基礎。電力大數據技術的發展從某種意義上講,可以看成是云計算技術在智能電網中,高級業務需求的實現過程。
2 電力大數據平臺的總體架構
Apache基金會開源技術通用的大數據平臺整體架構具有較好的通用性,適用于電力企業大數據的規劃,其主要思想是利用基于Hadoop文件系統(Hadoopdistributed file system,HDFS)的分布式文件處理系統作為大數據的存儲框架,利用基于MapReduce的分布式計算技術作為大數據的處理框架。
以分布式文件處理技術為基礎,使PB、ZB級的數據存儲成為可能;以分布式計算技術為基礎,使得PB、ZB級數據的查詢分析成為可能。另外該框架中還包含商業智能應用、傳統的數據倉庫、大數據訪問框架、大數據調度框架、網絡層、操作系統、服務器、備份和恢復、數據管理等模塊。
大數據存儲框架和大數據處理框架通常構建在通用的服務器、操作系統或者虛擬機上,使得該架構所需的硬件具有低成本和高擴展性的特點,標準的普通服務器或者PC機即可成為基于該架構的終端構成單元。
大數據存儲框架和大數據處理框架之上是通過網絡層連接的大數據訪問框架,該訪問框架包含并行計算機編程語言Pig、數據倉庫工具Hive、開源數據傳遞工具Sqoop 等子模塊。
大數據調度框架包含基于列存儲的開源非關系型數據庫Hbase、數據序列化格式與傳輸工具Avro、日志收集系統Flume、分布式鎖設施ZooKeeper等模塊。
大數據調度框架實現了對大數據的組織與調度,為數據分析提供了必要條件。在大數據調度框架之上是企業級商業智能應用系統,可以開展查詢、分析、統計、報表等高級應用。大數據的管理、安全和備份恢復框架幫助進行大數據的治理和保護。
該框架幾乎涵蓋了大數據技術的所有環節,值得指出的是,通過該訪問框架不僅可以實現對分布式文件存儲系統的訪問,而且通過大數據連接器和開源數據傳遞工具Sqoop可以實現對傳統數據倉庫的訪問。
大數據的處理流程可以定義為在合適工具的輔助下,對廣泛異構的數據源進行抽取和集成,按照統一的標準對結果進行存儲,利用恰當的數據分析技術對存儲的數據進行分析,達到從中提取出有價值的知識的目的,并用合適的方式將結果展現給終端用戶。
對電力企業來講,電力大數據的基本處理流程與傳統數據處理流程并無太大差異,主要區別在于:電力大數據需要處理大量、非結構的數據,所以在各個環節都可以采用MapReduce等方式進行并行處理。
電力系統是一種高維非線性的復雜系統,其內部的數據流包含電力流、信息流、業務流、故障流、氣象流等不同的數據流向。
對這些電力系統的子信息源而言,一方面可以單獨應用大數據技術,提升其產業價值,例如電力設備在線監測系統本身就是一個大數據系統,另一方面可以融合不同的子信息源,在更高的層面上構件大數據平臺,例如融合電能計量系統、SCADA系統、MIS系統、負荷控制系統,可以構建基于大數據平臺的網損分析系統,實現網損的自動統計與分析。
基于該網損分析大數據平臺,還可開展基于自動網損統計的用戶竊電行為挖掘,實現更深層次的應用。
3 電力大數據關鍵技術
3.1 電力大數據的集成管理技術
電力企業數據集成管理技術是合并來自2個或者多個應用系統的數據,創建一個具有更多功能的企業應用的過程。從集成的角度來說,就是把不同來源、格式、特點、性質的數據在邏輯上或者存儲介質上有機地集中,為系統存儲一系列面向主題的、集成的、相對穩定的、反映歷史變化的數據集合,從而為系統提供全面的數據共享。電力企業集成管理技術就是為解決電力企業內部各系統間的數據冗余和信息孤島而產生的。
電力大數據的數據集成管理技術,包含關系型和非關系型數據庫技術、數據融合和集成技術、數據抽取技術、過濾技術和數據清洗等。大數據的一個重要特點就是多樣性,這就意味著數據來源極其廣泛,數據類型極為繁雜,這種復雜的數據環境給大數據的處理帶來極大的挑戰,要想處理大數據,首先必須對數據源的數據進行抽取和集成,從中提取出實體和關系,經過關聯和聚合之后采用統一的結構來存儲這些數據,在數據集成和提取時需要對數據進行清洗,保證數據質量及可靠性。
大數據存儲管理中一個重要的技術是NoSQL數據庫技術,它采用分布式數據存儲方式,去掉了關系型數據庫的關系型特性,數據存儲被簡化且更加靈活,具有良好的可擴展性,解決了海量數據的存儲難題。有代表性的NoSQL 數據庫技術有Google的BigTable和Amazon的Dynamo等。
3.2 電力大數據的數據分析技術
大數據技術的根本驅動力是將信號轉化為數據,將數據分析為信息,將信息提煉為知識,以知識促成決策和行動。借助電力大數據的分析技術可以從電力系統的海量數據中找出潛在的模態與規律,為決策人員提供決策支持。
麥肯錫認為可用于大數據分析的關鍵技術源于統計學和計算機科學等學科,包含關聯分析、機器學習、數據挖掘、模式識別、神經網絡、時間序列預測模型、遺傳算法等多種不同的方法。
大數據研究不同于傳統的邏輯推理研究,是對巨大數量的數據做統計性的搜索、分類、比較、聚類等的分析和歸納,因此繼承了統計科學的一些特點,如統計學關注的數據相關性或稱關聯性,所謂“相關性”是指2個或2個以上變量的取值之間存在某種規律性[7]!跋嚓P分析”的目的是找出數據集里隱藏的關系網,一般用支持度、可信度、興趣度等參數反映相關性。
牛津大學網絡學院教授維克多在他的著作《大數據時代》中指出:在大數據時代,相關關系分析法將大放異彩,通過找到一個良好現象的關聯物,相關關系分析可以捕獲現在和預測未來。大數據相關關系分析法,建立在海量樣本的基礎上,不采用隨機分析法這樣的捷徑,而采用分析所有數據的方法;大數據的簡單算法比小數據的復雜算法更有效,其結果更快、更準確而且不易受到干擾,因此他指出建立在相關關系分析法基礎上的預測是大數據的核心。
大數據這種不注重因果關系側重于相關關系的分析方法,帶來了科學研究思維方式的重大轉變,已故圖靈獎得主吉姆˙格雷提出的數據密集型科研“第四范式”,將大數據科研從前3 種范式(理論科學、計算科學、實驗科學)中分離出來,單獨作為一種科研范式,正是因為其研究方式不同于基于數學模型的傳統研究方式。
電力大數據分析技術,從根本上講,屬于傳統數據挖掘技術在海量數據挖掘下的新發展,但由于大數據海量、高速增長、多樣性的特點,并且不僅包含結構化數據,還含半結構化和非機構化數據,因此傳統的很多處理小數據的數據挖掘方法已經不再實用。
大數據環境下的數據挖掘與機器學習算法,可以從3個方面著手:1)從大數據的治理與抽樣、特征選擇的角度入手,將大數據小數據化;2)開展大數據下的聚類、分類算法研究,例如基于共軛度的最小二乘支持向量機(least squares support vector machine,LS-SVM)],隨機可擴展FuzzyC-Means (FCM)等;3)開展大數據的并行算法,將傳統的數據挖掘方法通過并行化,應用到大數據的知識挖掘中,例如基于MapReduce的機器學習與知識挖掘。
3.3 電力大數據的數據處理技術
電力大數據的數據處理技術包括分布式計算技術,內存計算技術,流處理技術等。分布式計算技術是為了解決大規模數據的分布式存儲與處理。內存計算技術是為了解決數據的高效讀取和處理在線的實時計算。流處理技術則是為了處理實時到達的、速度和規模不受控制的數據。
分布式計算是一種新的計算方式,研究如何將一個需要強大計算能力才能解決的問題分解為許多小的部分,然后再將這些部分分給多個計算機處理,最后把結果綜合起來得到最終結果。
分布式計算的一個典型代表是Google公司提出的MapReduce編程模型,該模型先將待處理的數據進行分塊,交給不同的Map任務區處理,并按鍵值存儲到本地硬盤,再用Reduce任務按照鍵值將結果匯總并輸出最終結果。分布式技術適用于電力系統信息采集領域的大規模分散數據源。
內存計算技術是將數據全部放在內層中進行操作的計算技術,該技術克服了對磁盤讀寫操作時的大量時間消耗,計算速度得到幾個數量級的大幅提升。內層計算技術伴隨著大數據浪潮的來臨和內存價格的下降得到快速的發展和廣泛的應用,EMC、甲骨文、SAT都推出了內存計算的解決方案,將客戶以前需要以天作為時間計算單位的業務降低為以秒作為時間計算單位,解決了大數據實時分析和知識挖掘的難題。
流處理的處理模型是將源源不斷的數據組視為流,當新的數據到來時就立即處理并返回結果,其基本理念是數據的價值會隨著時間的流逝而不斷減少,因此盡可能快地對最新的數據做出分析并給出結果,其應用場景主要有網頁點擊的實時統計、傳感器網絡、金融中的高頻交易等[8]。
隨著電力事業的發展,電力系統數據量不斷增長,對實時性的要求也越來越高,將數據流技術應用于電力系統可以為決策者提供即時依據,滿足實時在線分析需求。
3.4 電力大數據的數據展現技術
電力大數據的數據展現技術包括可視化技術、空間信息流展示技術、歷史流展示技術等。可視化技術、空間信息流展示技術、歷史流展示技術從3個不同的方面詮釋了電力大數據展現技術的豐富內涵。借助電力大數據的數據展現技術可幫助管理人員更直觀、準確地理解電力系統數據表達的意義,了解電力系統的運行狀態。
可視化技術廣泛應用于電網狀態的實時監控,顯著提高了電力系統的自動化水平。未來電力系統可視化還可結合復雜網絡中的相關理論在電網自動分層分區、自動布點等方面展開深入研究,發掘電網更深層次的規律和聯系。
空間信息流展示技術主要體現在電網參數與已有地理信息系統的結合上,包含變電站三維展示、虛擬現實等技術。將電力配電設備管理與地理信息系統緊密結合起來,有利于電網管理人員直觀地了解設備情況,從而為其決策提供最新的地理信息。在變電站工程設計中用空間信息流展示技術可以節約時間、資源、成本,為電力企業帶來巨大的效益。
歷史流展示技術體現在對電網歷史數據的管理與展示上。在電力系統中,深層次的應用分析往往以歷史數據為基礎。對生產現場的實時監測數據、電網的規劃數據和負荷預測數據,通過歷史流展示技術,可以繪制出數據的發展趨勢并預測出未來的數據走勢;通過歷史流回放展示技術,可以模擬歷史重大事件發生、演變,挖掘歷史事件潛在的知識與規律。
4 大數據在智能電網中的應用
電力大數據的應用場合涵蓋發、輸、變、配、用、調等電力行業的各個環節,在風電場選址、降低網損、風電并網、電網安全監測、大災難預警、電力企業精細化運營、電力設備狀態監測等領域有非常強的可實現性。
5 結論與展望
本文探討了大數據、云計算、智能電網三者之間的相互關系,并給出電力大數據的總體可執行框架,對電力企業大數據平臺的搭建具有參考價值。
本文闡述了電力大數據平臺中4個核心的關鍵技術,即集成管理技術、分析技術、處理技術、展現技術。大數據的集成管理技術應該考慮關系型和非關系型數據庫技術的綜合應用,并重點考慮NoSQL數據庫技術;大數據的分析技術應從大數據的治理與抽樣、大數據特征選擇、大數據小數據化、大數據的分類算法、大數據挖掘并行化等方面開展研究;大數據的處理技術應根據具體的應用需求考慮分布式計算、內存計算、流處理等技術;電力大數據的數據展現技術可考慮可視化技術、空間信息流展示技術、歷史流展示技術等。
大數據技術在商業領域已經獲得較為廣泛的應用并創造出巨大的商業價值,但是在電力系統中的應用才剛剛起步,因此結合大數據的技術優勢和電力系統的應用需求,發揮電力大數據的價值,將為智能電網的建設帶來新的發展契機。
電力企業應該牢牢抓住這個契機,從數據政策、人才培養、關鍵技術研發等層面,全面促成電力大數據技術的發展。
保定市四北電子有限公司具有卓越的產品性能、優良的品質、高可靠的電源設計,并提供定制開關電源服務,F已形成幾大系列產品:開關電源系列、逆變電源系列、充電電源系列、備用電源系列等產品。提供AC/DC、DC/DC、DC/AC基板式、模塊式、嵌入式等各種形式專用電源。
主要電源類別有:電力自動化設備專用電源;通訊領域專用電源;電力測試儀器專用電源;機車控制系統電源:高壓激光電源;浮充電電源;UPS電源;伺服式交流穩壓電源;ZDD系列20W∽3KW逆變電源。http://www.www.56436.cn
【上一個】 開關電源廠家簡說逆變器對于提升電網品質的幫助 | 【下一個】 四北電子公司介紹如何設計高效小型化開關電源 |
^ 開關電源廠家口若懸河講面向智能電網應用的電力大數據關鍵技術 |