基于知識(shí)數(shù)據(jù)化表達(dá)的制冷空調(diào)系統(tǒng)故障診斷方法
隨著近年來(lái)能源與碳排放問(wèn)題的突顯,世界各國(guó)紛紛制定自己的能源戰(zhàn)略,我國(guó)也將能源戰(zhàn)略放在了突出的位置,提出了“碳達(dá)峰·碳中和”的戰(zhàn)略目標(biāo)[1]。制冷空調(diào)系統(tǒng)主要用于建筑的環(huán)境調(diào)節(jié),也可用于工業(yè)環(huán)境控制,其能耗已成為建筑能耗的重要組成部分,約占社會(huì)能耗總量的20% [2]。由于制冷空調(diào)系統(tǒng)結(jié)構(gòu)復(fù)雜、設(shè)備種類(lèi)繁多,存在多種熱質(zhì)交換和功熱轉(zhuǎn)換形式,在運(yùn)行過(guò)程中不可避免會(huì)發(fā)生各類(lèi)故障。相關(guān)研究表明,制冷空調(diào)系統(tǒng)故障運(yùn)行會(huì)造成15%~20%的能耗增加[3]。
長(zhǎng)期以來(lái),空調(diào)系統(tǒng)的運(yùn)行維護(hù)管理以“定期檢修+報(bào)警搶修”模式為主,盲目性高且難以發(fā)現(xiàn)隱性故障。通過(guò)人工智能的方式可極大提高故障特征的自主辨識(shí),實(shí)現(xiàn)全時(shí)段智能監(jiān)控,降低對(duì)運(yùn)維人員專(zhuān)業(yè)素養(yǎng)的依賴[4]。制冷空調(diào)系統(tǒng)是一類(lèi)復(fù)雜的熱力系統(tǒng),故障狀態(tài)下系統(tǒng)的熱力參數(shù)會(huì)較原狀態(tài)產(chǎn)生偏離,即故障的熱力學(xué)征兆,如溫度升高、壓力降低等。偏離后的熱力參數(shù)值不僅與故障狀態(tài)有關(guān),同時(shí)受環(huán)境、負(fù)荷、工況等諸多因素影響,使得故障和征兆之間的關(guān)系不僅復(fù)雜而且存在不確定性。這種故障-征兆的復(fù)雜映射關(guān)系給故障診斷規(guī)則制定帶來(lái)極大挑戰(zhàn),使得基于規(guī)則的故障診斷方法難以保證精度。以深度學(xué)習(xí)為代表的數(shù)據(jù)驅(qū)動(dòng)方法憑借其強(qiáng)大的特征提取能力,可以較好地解決復(fù)雜熱力系統(tǒng)的診斷難題。Sun等[5-6]針對(duì)熱泵空調(diào)系統(tǒng)的深度學(xué)習(xí)故障診斷方法展開(kāi)研究,提出一種基準(zhǔn)模型+深度卷積網(wǎng)絡(luò)的診斷框架,實(shí)現(xiàn)了系統(tǒng)偏離特性的高效提取,很好地提升了復(fù)雜熱力系統(tǒng)的診斷精度。Wang等[7]面向現(xiàn)場(chǎng)應(yīng)用場(chǎng)景展開(kāi)診斷方法研究,利用貝葉斯網(wǎng)絡(luò)實(shí)現(xiàn)特征高效篩選,解決了現(xiàn)場(chǎng)診斷傳感器數(shù)量少、成本受限等實(shí)際問(wèn)題。van de Sand等[8]針對(duì)冷水機(jī)組故障診斷問(wèn)題,提出一種基于區(qū)域自適應(yīng)的數(shù)據(jù)驅(qū)動(dòng)診斷方法,緩解了監(jiān)督學(xué)習(xí)對(duì)標(biāo)記樣本的依賴。劉旭婷等[9]針對(duì)冷水機(jī)組提出一種基于稀疏局部嵌入深度卷積網(wǎng)絡(luò)的故障診斷方法,采用稀疏局部嵌入代替卷積核,有效避免了復(fù)雜的訓(xùn)練和調(diào)參。王路瑤等[10]基于長(zhǎng)短時(shí)記憶神經(jīng)網(wǎng)絡(luò)提出一種空調(diào)系統(tǒng)傳感器故障檢測(cè)方法,有效緩解了大滯后系統(tǒng)時(shí)序建模精度低的難題。Xiao等[11-14]較早提出了基于貝葉斯網(wǎng)絡(luò)的診斷框架,大量研究成果為學(xué)科后續(xù)發(fā)展提供極具價(jià)值的新思路。Li等[15-17]提出一系列基于深度學(xué)習(xí)的智能診斷算法用于解決多聯(lián)機(jī)、空氣源熱泵、熱泵熱水器等諸多裝置的故障診斷問(wèn)題。
數(shù)據(jù)驅(qū)動(dòng)方法的優(yōu)勢(shì)在于可以從數(shù)據(jù)中自學(xué)習(xí)復(fù)雜映射關(guān)系,這就使得其對(duì)標(biāo)記樣本的質(zhì)量和豐富度具有嚴(yán)重依賴,而真實(shí)應(yīng)用場(chǎng)景中足質(zhì)足量的標(biāo)記樣本往往難以獲取。隨著智能化技術(shù)逐步走向應(yīng)用,解決標(biāo)記數(shù)據(jù)依賴問(wèn)題已成為當(dāng)下研究的重中之重,近兩年來(lái)越來(lái)越多的學(xué)者[18]針對(duì)這一問(wèn)題展開(kāi)研究。將機(jī)理知識(shí)融入數(shù)據(jù)驅(qū)動(dòng)不僅可以降低對(duì)標(biāo)記數(shù)據(jù)的依賴,同時(shí)可以提高診斷方法的魯棒性和可靠性。張鈸等[19]指出,將機(jī)理知識(shí)融入數(shù)據(jù)驅(qū)動(dòng)是新一代人工智能發(fā)展的必經(jīng)之路。制冷空調(diào)系統(tǒng)故障診斷的實(shí)質(zhì)是通過(guò)對(duì)系統(tǒng)表現(xiàn)的征兆進(jìn)行模式識(shí)別而得出診斷結(jié)論,故障和征兆的定性關(guān)系可以通過(guò)熱力學(xué)分析得出,其征兆的規(guī)律性描述正是診斷模型的診斷依據(jù)。因此,通過(guò)故障規(guī)律性知識(shí)指導(dǎo)實(shí)現(xiàn)故障的模式識(shí)別,在理論上是可行的。然而,實(shí)際情況中,制冷空調(diào)系統(tǒng)常面臨環(huán)境多變、負(fù)荷多變以及控制需求多變的問(wèn)題,導(dǎo)致其運(yùn)行工況持續(xù)處于動(dòng)態(tài)過(guò)程。動(dòng)態(tài)條件下的系統(tǒng)征兆也會(huì)隨之變化,使得故障和征兆的映射關(guān)系出現(xiàn)不確定性,這種動(dòng)態(tài)征兆是難以通過(guò)熱力學(xué)精準(zhǔn)分析的。如何利用定性的靜態(tài)征兆知識(shí)指導(dǎo)實(shí)現(xiàn)動(dòng)態(tài)系統(tǒng)的故障診斷是一個(gè)非常困難的問(wèn)題。
本課題組前期研究發(fā)現(xiàn),制冷空調(diào)系統(tǒng)故障征兆的實(shí)質(zhì)是熱力參數(shù)偏離正?;鶞?zhǔn),多變工況下參數(shù)偏離的方向一致,其差異在于偏離大小。例如高負(fù)荷下相同故障的參數(shù)偏離量更大。利用熱力學(xué)機(jī)理分析容易得到故障條件下參數(shù)的偏離方向,但卻難以針對(duì)所有工況預(yù)測(cè)出偏離大小。而事實(shí)上,診斷的目標(biāo)只是將故障類(lèi)別識(shí)別出,無(wú)論何種偏離程度均對(duì)應(yīng)同一類(lèi)故障結(jié)果。如果利用一種隨機(jī)生成的策略在偏離方向的基礎(chǔ)上獲得不同偏離大小的偽樣本,則相當(dāng)于得到了不同工況下系統(tǒng)故障的標(biāo)記數(shù)據(jù),進(jìn)而解決標(biāo)記樣本不足的問(wèn)題。因此,本文提出一種基于知識(shí)數(shù)據(jù)化表達(dá)的制冷空調(diào)系統(tǒng)故障診斷方法。首先,通過(guò)機(jī)理分析構(gòu)建故障的定性偏離矢量,然后通過(guò)一種數(shù)據(jù)隨機(jī)縮放策略實(shí)現(xiàn)知識(shí)的數(shù)據(jù)化表達(dá),達(dá)到信息擴(kuò)增的目的。在實(shí)施診斷時(shí)為了將真實(shí)系統(tǒng)的熱力參數(shù)轉(zhuǎn)換成生成樣本的偏離形式,提出一種基于基準(zhǔn)模型的偏離特性的表征策略。最終,以知識(shí)驅(qū)動(dòng)代替標(biāo)記樣本實(shí)現(xiàn)制冷空調(diào)系統(tǒng)的故障診斷。
1 制冷空調(diào)系統(tǒng)故障診斷知識(shí)的數(shù)據(jù)化表達(dá)
制冷空調(diào)系統(tǒng)故障狀態(tài)的表現(xiàn)形式是熱力參數(shù)的偏離,這種偏離包含大小和方向兩部分。對(duì)于同一種故障而言,不同系統(tǒng)間以及同一系統(tǒng)在不同條件下的特征偏離方向是一致的,不同點(diǎn)在于偏離大小,其受到系統(tǒng)結(jié)構(gòu)、環(huán)境條件和運(yùn)行工況等不同因素的影響。如果要精確計(jì)算出理論上的偏離大小無(wú)疑是十分困難的。而事實(shí)上,故障診斷完全可以僅依賴不同熱力參數(shù)的偏離方向進(jìn)行識(shí)別。因此,定性的偏離知識(shí)表達(dá)理論上是可以支撐故障診斷的。可以通過(guò)熱力學(xué)分析、數(shù)值仿真、實(shí)驗(yàn)測(cè)試等手段獲得特定系統(tǒng)的故障定性偏離規(guī)律,這種規(guī)律是模糊的偏離方向和偏離程度,如參數(shù)1偏大且偏離程度為嚴(yán)重。詳細(xì)的偏離知識(shí)示例見(jiàn)3.1節(jié)。
這種定性的規(guī)則較早被應(yīng)用到制冷空調(diào)系統(tǒng)故障診斷中,稱之為基于規(guī)則的診斷方法[20],然而精度均不理想,導(dǎo)致這種結(jié)果的原因是制冷空調(diào)系統(tǒng)復(fù)雜且多變,故障和征兆之間的映射關(guān)系不僅高度非線性且具有一定的不確定性。而數(shù)據(jù)驅(qū)動(dòng)方法可以通過(guò)學(xué)習(xí)數(shù)據(jù)分布中的深度特征而實(shí)現(xiàn)故障-征兆間復(fù)雜映射關(guān)系的擬合,其診斷精度遠(yuǎn)高于基于規(guī)則的方法。因此,2010年以后,絕大多數(shù)制冷空調(diào)故障診斷研究都聚焦于數(shù)據(jù)驅(qū)動(dòng)方法[21-25]。如果能將制冷空調(diào)系統(tǒng)故障的定性偏離規(guī)律以數(shù)據(jù)的形式表達(dá)并通過(guò)信息擴(kuò)增手段豐富其信息量,則可以在不依賴真實(shí)標(biāo)記數(shù)據(jù)的條件下充分利用數(shù)據(jù)驅(qū)動(dòng)優(yōu)勢(shì)。
故障狀態(tài)參數(shù)偏離的表示形式可以稱之為故障診斷知識(shí)的多維偏離矢量,每一個(gè)參數(shù)既含有方向又含有程度,如果對(duì)不同的偏離程度賦予特定的值,則從數(shù)據(jù)的角度可以將其看作一條標(biāo)記樣本。然而僅利用這一條標(biāo)記樣本顯然無(wú)法滿足數(shù)據(jù)驅(qū)動(dòng)模型的訓(xùn)練。如何對(duì)多維偏離矢量的信息進(jìn)行擴(kuò)增,是亟需解決的問(wèn)題。由于不同偏離大小代表不同情形下的故障數(shù)據(jù),這種情形越多代表數(shù)據(jù)的信息越豐富。在一定的范圍內(nèi)對(duì)賦值后的多維偏離矢量進(jìn)行縮放則可以模擬生成不同情形下的標(biāo)記數(shù)據(jù)。本文提出一種數(shù)據(jù)隨機(jī)縮放策略,基于多維偏離矢量生成大量偽數(shù)據(jù),用于深度模型訓(xùn)練。數(shù)據(jù)隨機(jī)縮放策略的目的就是使多維偏離矢量各個(gè)維度經(jīng)過(guò)等比放大或縮小,實(shí)現(xiàn)不同偏離量的模擬??s放策略的目的是增加矩陣數(shù)據(jù)的信息熵,以提高深度模型的學(xué)習(xí)效果。偏離數(shù)據(jù)是故障模式識(shí)別的依據(jù),其主要特征在于偏離方向和偏離大小,對(duì)于深度模型而言,相同的偏離方向下不同的偏離幅值對(duì)模型分類(lèi)具有明顯影響。不同制冷空調(diào)系統(tǒng)由于運(yùn)行工況、所處環(huán)境以及故障嚴(yán)重程度的差異,同一種故障的偏離幅值存在差異,用于訓(xùn)練的數(shù)據(jù)需要盡可能多地包含不同偏離幅值樣本。數(shù)據(jù)縮放策略就是基于這一思路,對(duì)矩陣數(shù)據(jù)乘以縮放系數(shù)后得到放大或縮小的矩陣樣本,如
多時(shí)間步多維度的偏離數(shù)據(jù)構(gòu)成矩陣數(shù)據(jù),矩陣數(shù)據(jù)的所有元素均等比縮放,得到新的樣本。這里縮放前的矩陣數(shù)據(jù)可以是真實(shí)偏離矩陣也可以是人工賦值的偏離矢量。通過(guò)多個(gè)縮放系數(shù)對(duì)矩陣數(shù)據(jù)縮放可以得到多組新的矩陣數(shù)據(jù),例如利用0.5、0.75、1.5、2.1四個(gè)縮放系數(shù)對(duì)同一矩陣數(shù)據(jù)縮放就可以得到四個(gè)新的矩陣數(shù)據(jù)??s放系數(shù)在設(shè)定的縮放范圍內(nèi)隨機(jī)取值,而縮放系數(shù)的個(gè)數(shù)取決于診斷模型所需的訓(xùn)練樣本數(shù),這通??梢愿鶕?jù)神經(jīng)網(wǎng)絡(luò)模型的大小而確定,例如訓(xùn)練樣本需要包含每類(lèi)故障3000組樣本,則在縮放范圍內(nèi)隨機(jī)生成3000個(gè)縮放系數(shù)。
圖1是以三類(lèi)故障為例對(duì)縮放策略進(jìn)行描述,每類(lèi)故障選取四個(gè)特征(蒸發(fā)溫度TRE、冷凝溫度TRC、吸氣溫度T_suc、排氣溫度TR_dis),每一行代表一個(gè)時(shí)間點(diǎn),每個(gè)樣本是6×4矩陣數(shù)據(jù),這里具體數(shù)值是根據(jù)偏離矢量設(shè)定的偏離值,每類(lèi)故障對(duì)應(yīng)一個(gè)偏離矩陣。圖1中分別為3、0.5、1.5這三個(gè)縮放系數(shù)生成的三個(gè)樣本,該樣本作為診斷模型的輸入。圖中的縮放過(guò)程與上文描述有兩處不同:(1)紅色參數(shù)并沒(méi)有進(jìn)行縮放;(2)每個(gè)縮放后的數(shù)值均添加了一個(gè)較小的隨機(jī)數(shù)。
圖1
圖1 數(shù)據(jù)隨機(jī)縮放策略
Fig.1 Data random scaling strategy
由于真實(shí)樣本具有一定的不確定性,簡(jiǎn)單利用縮放系數(shù)進(jìn)行偽樣本生成,其效果是不理想的。本文進(jìn)一步提出對(duì)生成樣本添加標(biāo)準(zhǔn)正態(tài)分布的高斯噪聲,豐富數(shù)據(jù)的信息復(fù)雜度,以此提升模型準(zhǔn)確性和魯棒性。標(biāo)準(zhǔn)正態(tài)分布是最符合自然界真實(shí)分布的,利用該類(lèi)噪聲可以更好地模擬系統(tǒng)真實(shí)擾動(dòng)。噪聲添加策略使性能得到提升的原因主要有兩個(gè)方面:(1)真實(shí)殘差數(shù)據(jù)本身是有較大隨機(jī)波動(dòng)的,單純的等比縮放與真實(shí)情況不符,高斯噪聲模擬的是系統(tǒng)的隨機(jī)擾動(dòng),而偏離量模擬的是系統(tǒng)偏離正常工況,二者疊加則表示不同隨機(jī)擾動(dòng)下系統(tǒng)均呈現(xiàn)一種固定的偏離模式,而故障診斷的目的就是識(shí)別這種模式,使生成分布與真實(shí)分布更接近;(2)添加噪聲實(shí)質(zhì)是添加擾動(dòng),這種思路借鑒了神經(jīng)網(wǎng)絡(luò)中的Dropout層[26],該網(wǎng)絡(luò)層通過(guò)隨機(jī)失活部分神經(jīng)元以實(shí)現(xiàn)擾動(dòng)添加,使神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)過(guò)程得到強(qiáng)化,從而有效避免神經(jīng)網(wǎng)絡(luò)過(guò)擬合,是公認(rèn)的提升神經(jīng)網(wǎng)絡(luò)魯棒性的方法。本文借鑒這一思路以添加噪聲的方式強(qiáng)化神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)過(guò)程,使得模型更加聚焦于偏離規(guī)則這種共性特征。同時(shí),噪聲的添加強(qiáng)度對(duì)診斷結(jié)果影響較大,弱噪聲起不到模擬擾動(dòng)的作用,強(qiáng)噪聲則會(huì)引入過(guò)多的干擾從而降低診斷精度,因此,需要實(shí)驗(yàn)驗(yàn)證最優(yōu)的噪聲添加強(qiáng)度。
此外,本文還提出隨機(jī)縮放策略有三個(gè)關(guān)鍵的技巧,可以保證其有效實(shí)施。(1)并不是所有特征都進(jìn)行縮放,不產(chǎn)生偏離的特征不進(jìn)行縮放,這些不偏離的特征可以根據(jù)故障自身的規(guī)律人為指定,如圖1中紅色數(shù)據(jù),以避免非偏離參數(shù)的誤差被放大強(qiáng)化。(2)不產(chǎn)生偏離的特征要設(shè)置一個(gè)小于1的值,比如0.1,實(shí)驗(yàn)證明這樣比1的效果好很多。(3)縮放系數(shù)的生成范圍設(shè)定非常關(guān)鍵,縮放范圍需要考慮目標(biāo)系統(tǒng)可能出現(xiàn)的嚴(yán)重程度,越嚴(yán)重的故障偏離量越大,而這種偏離量可以根據(jù)經(jīng)驗(yàn)估算??s放后的偏離數(shù)據(jù)的上下限應(yīng)包含所有故障程度下的偏離范圍。例如目標(biāo)系統(tǒng)可能出現(xiàn)的冷凝溫度最大故障偏離小于5℃,最小故障偏離大于1℃,設(shè)定的該偏離矢量值為2,則縮放范圍需覆蓋(0.5, 2.5)。由于多維偏離矢量的不同參數(shù)縮放范圍可能不同,最終的統(tǒng)一縮放范圍應(yīng)取大。經(jīng)過(guò)隨機(jī)的縮放后,生成的偽數(shù)據(jù)包含了各類(lèi)情況下的系統(tǒng)故障信息,以此訓(xùn)練深度模型可以很好地保證其在實(shí)際診斷時(shí)的適用性。這一過(guò)程的實(shí)質(zhì)就是實(shí)現(xiàn)了故障診斷知識(shí)的數(shù)據(jù)化表達(dá),其完整的流程見(jiàn)圖2。
圖2
圖2 知識(shí)的數(shù)據(jù)化表達(dá)流程
Fig.2 The expression process of digitized knowledge
2 基于知識(shí)數(shù)據(jù)化表達(dá)的制冷空調(diào)系統(tǒng)故障診斷方法
基于數(shù)據(jù)化的知識(shí)實(shí)現(xiàn)完整的制冷空調(diào)系統(tǒng)故障診斷流程見(jiàn)圖3。方法分為兩個(gè)部分。(1)模型訓(xùn)練:使用數(shù)據(jù)化的知識(shí)訓(xùn)練診斷模型,使之得到故障診斷的劃分邊界,訓(xùn)練完畢的模型用于診斷目標(biāo)系統(tǒng)故障類(lèi)別。(2)診斷實(shí)施:通過(guò)偏離特性表征策略,使真實(shí)運(yùn)行數(shù)據(jù)以偏離殘差的形式表征,這種表征形式和數(shù)據(jù)化的知識(shí)形式相同,從而使得診斷模型可以對(duì)其進(jìn)行診斷分類(lèi)。
圖3
圖3 診斷總體流程圖
Fig.3 The flowchart of proposed method
2.1 生成樣本一致性評(píng)估方法
第1節(jié)中利用隨機(jī)縮放策略實(shí)現(xiàn)了知識(shí)數(shù)據(jù)化表達(dá),生成了帶有標(biāo)記的偽數(shù)據(jù),這種生成數(shù)據(jù)的質(zhì)量高低決定了訓(xùn)練模型的診斷效果。因此,首先要對(duì)生成樣本的一致性進(jìn)行評(píng)估,目的是為了獲得和真實(shí)分布差異最小的生成樣本。
對(duì)于數(shù)據(jù)分布的距離評(píng)估有很多種方法,如核最大平均差異(kernel maximum mean discrepancy,MMD)[27]、瓦瑟斯坦距離(Wasserstein distance)[28]和弗雷歇距離(Fréchet inception distance,F(xiàn)ID)[29]等。其中MMD距離最常用于估計(jì)兩分布差異 [30]。在固定的核函數(shù)下,MMD指標(biāo)用于度量真實(shí)分布和生成分布的差異,MMD值越小,代表兩分布差異越小。MMD指標(biāo)可以定義為
式中,
2.2 目標(biāo)系統(tǒng)偏離特性的表征策略
生成數(shù)據(jù)其實(shí)質(zhì)是系統(tǒng)熱力參數(shù)偏離特征,而目標(biāo)系統(tǒng)直接采集的運(yùn)行數(shù)據(jù)是真實(shí)的熱力值。如果要使用生成數(shù)據(jù)訓(xùn)練模型診斷目標(biāo)系統(tǒng),則必須將目標(biāo)系統(tǒng)的數(shù)據(jù)以偏離特征的形式予以表征。偏離特征是指故障狀態(tài)下熱力參數(shù)偏離理論正常值,獲取偏離特征則首先需要精準(zhǔn)得到理論上的基準(zhǔn)值。熱力參數(shù)受到多種因素影響,呈現(xiàn)非線性、強(qiáng)耦合的特征。如排氣壓力這一熱力參數(shù)不僅與系統(tǒng)結(jié)構(gòu)和工質(zhì)有關(guān),還與環(huán)境溫度、負(fù)荷大小、控制目標(biāo)溫度等多種因素有關(guān)。要想在考慮眾多因素的情況下準(zhǔn)確預(yù)測(cè)熱力健康值是十分困難的。本課題組前期提出一種基于深度神經(jīng)網(wǎng)絡(luò)的制冷空調(diào)系統(tǒng)基準(zhǔn)模型[5],該模型融合卷積網(wǎng)絡(luò)、編-解碼器、循環(huán)神經(jīng)網(wǎng)絡(luò),以數(shù)據(jù)驅(qū)動(dòng)的方式解決了大滯后、強(qiáng)耦合系統(tǒng)建模困難的問(wèn)題,模型結(jié)構(gòu)如圖4所示。該模型處理時(shí)序數(shù)據(jù),每個(gè)樣本包含前置時(shí)間段(t1~tn )和預(yù)測(cè)時(shí)間段(tn+1~tn+m )。前置時(shí)間段僅包含狀態(tài)參數(shù),通常為10~15個(gè)時(shí)間步長(zhǎng),預(yù)測(cè)時(shí)間段包含之后的時(shí)間步的輸入?yún)?shù),結(jié)合后續(xù)診斷模型要求的數(shù)據(jù)結(jié)構(gòu),預(yù)測(cè)時(shí)間段可以是10~20個(gè)時(shí)間步長(zhǎng)。前置時(shí)間段的數(shù)據(jù)是二維矩陣數(shù)據(jù)(參數(shù)個(gè)數(shù)×?xí)r間步長(zhǎng)),表征預(yù)測(cè)開(kāi)始前一段時(shí)間系統(tǒng)的持續(xù)狀態(tài),對(duì)大滯后系統(tǒng)預(yù)測(cè)具有重要作用,這里使用卷積網(wǎng)絡(luò)處理前置時(shí)間段數(shù)據(jù)并輸入到編-解碼器。通過(guò)解碼器將前置狀態(tài)信息編碼到固定長(zhǎng)度的向量并輸入到循環(huán)神經(jīng)網(wǎng)絡(luò),作為該網(wǎng)絡(luò)的初始值,可以較好地繼承預(yù)測(cè)時(shí)間段開(kāi)始時(shí)刻系統(tǒng)所處的狀態(tài)。循環(huán)神經(jīng)網(wǎng)絡(luò)根據(jù)每一個(gè)時(shí)刻的輸入變量預(yù)測(cè)對(duì)應(yīng)時(shí)刻的狀態(tài)變量,最終實(shí)現(xiàn)多步狀態(tài)變量的預(yù)測(cè)。詳細(xì)的模型介紹和實(shí)驗(yàn)分析可以參考文獻(xiàn)[5, 30]。模型的輸入為系統(tǒng)的外界自變參數(shù),包括環(huán)境參數(shù)、控制參數(shù)、負(fù)載參數(shù),例如環(huán)境溫度、壓機(jī)轉(zhuǎn)速、膨脹閥開(kāi)度、風(fēng)機(jī)轉(zhuǎn)速等。輸出的預(yù)測(cè)值為系統(tǒng)的因變參數(shù),主要包括系統(tǒng)各類(lèi)溫度、壓力等熱力參數(shù),通常為故障的敏感特征參數(shù)。具體的輸入輸出變量需要根據(jù)數(shù)據(jù)集確定,本文使用的參數(shù)選擇方案見(jiàn)3.1節(jié)?;鶞?zhǔn)模型利用健康系統(tǒng)采集的運(yùn)行數(shù)據(jù)訓(xùn)練,實(shí)現(xiàn)健康系統(tǒng)的擬合,屬于回歸建模問(wèn)題。由于健康運(yùn)行數(shù)據(jù)通常容易獲取,因而該訓(xùn)練策略不會(huì)限制基準(zhǔn)模型的實(shí)際應(yīng)用。
圖4
圖4 制冷空調(diào)系統(tǒng)基準(zhǔn)模型結(jié)構(gòu)
Fig.4 The structure of refrigeration and air-conditioning system benchmark model
利用該基準(zhǔn)模型實(shí)現(xiàn)制冷空調(diào)系統(tǒng)基準(zhǔn)預(yù)測(cè),并以此計(jì)算出目標(biāo)系統(tǒng)參數(shù)偏離量,即實(shí)現(xiàn)了運(yùn)行數(shù)據(jù)向偏離特征的轉(zhuǎn)換。此時(shí)的偏離值是真實(shí)的偏離值,但不同熱力參數(shù)的偏離值含義不同,如排氣壓力偏離0.1 MPa已經(jīng)偏離很大了,而排氣溫度偏離0.5℃都不算大,這是由于不同參數(shù)的量綱不同。為了保證所有偏離量的含義相同,需要對(duì)其去量綱化。這里使用基準(zhǔn)模型的每個(gè)參數(shù)下的誤差作為量綱去除的系數(shù),誤差可以在驗(yàn)證數(shù)據(jù)集上通過(guò)對(duì)基準(zhǔn)模型預(yù)測(cè)值和真實(shí)值求平均差得到,例如在健康數(shù)據(jù)集中基準(zhǔn)模型對(duì)排氣溫度的預(yù)測(cè)誤差為0.5℃,則對(duì)每個(gè)真實(shí)的排氣溫度殘差除以0.5,得到統(tǒng)一的去量綱偏離量。具體表征策略如下。
第一步:獲取系統(tǒng)的熱力基準(zhǔn)信息。即得到系統(tǒng)各特征參數(shù)健康狀態(tài)下的理論值,該理論值受到環(huán)境、工況、負(fù)荷等多因素的共同影響。
第二步:獲取敏感特征的殘差值。即將第一步獲取的基準(zhǔn)值和系統(tǒng)實(shí)測(cè)值做差,得到的差值的實(shí)質(zhì)是熱力偏離量。
第三步:計(jì)算殘差與基準(zhǔn)誤差量的比值?;鶞?zhǔn)值獲取依賴預(yù)測(cè)模型,其自身帶有一定誤差,使得不產(chǎn)生偏離的特征亦會(huì)產(chǎn)生較小的殘差量,該值可以通過(guò)訓(xùn)練數(shù)據(jù)集計(jì)算得到。通過(guò)計(jì)算殘差和誤差的比值可以清晰得到偏離倍數(shù),同時(shí)對(duì)不同量綱實(shí)現(xiàn)統(tǒng)一。
本文提出的使用人工生成的偏離參數(shù)作為模型的訓(xùn)練數(shù)據(jù)的方法,診斷實(shí)施時(shí)同時(shí)需要將目標(biāo)系統(tǒng)的運(yùn)行數(shù)據(jù)轉(zhuǎn)化為偏離殘差,而不是直接使用實(shí)際運(yùn)行數(shù)據(jù)。其主要原因及優(yōu)勢(shì)為:(1)偏離殘差的本質(zhì)是故障特征,以偏離的形式表征故障可以極大降低數(shù)據(jù)的復(fù)雜度,抵消熱力系統(tǒng)自身滯后性和非線性對(duì)診斷帶來(lái)的影響,從而提高診斷精度。該結(jié)論在前期研究工作中已證明[5]。(2)本文利用生成數(shù)據(jù)代替真實(shí)標(biāo)記數(shù)據(jù)以解決標(biāo)記數(shù)據(jù)不足的問(wèn)題,利用故障熱力學(xué)偏離規(guī)律可以生成偏離殘差,但卻無(wú)法生成真實(shí)的運(yùn)行數(shù)據(jù)。因此,要想實(shí)現(xiàn)知識(shí)數(shù)據(jù)化表達(dá),這種數(shù)據(jù)必須是偏離殘差數(shù)據(jù)。
2.3 基于卷積神經(jīng)網(wǎng)絡(luò)的故障診斷模型
第1節(jié)介紹了數(shù)據(jù)縮放策略以實(shí)現(xiàn)知識(shí)的數(shù)據(jù)化表達(dá),隨著生成數(shù)據(jù)量的增多,生成數(shù)據(jù)分布和真實(shí)數(shù)據(jù)分布的重合度會(huì)隨之增加,但仍然不會(huì)完全重合,這就需要診斷算法具備一定的擴(kuò)展性。深度神經(jīng)網(wǎng)絡(luò)通過(guò)多層復(fù)雜變換處理樣本深層特征,可以較好地對(duì)樣本分布進(jìn)行擴(kuò)展。殘差數(shù)據(jù)是典型的多維時(shí)序數(shù)據(jù),可以將其認(rèn)為是一種矩陣數(shù)據(jù)。因此,診斷模型使用深度卷積網(wǎng)絡(luò)搭建,以充分利用其對(duì)矩陣數(shù)據(jù)復(fù)雜特征的學(xué)習(xí)能力,具體結(jié)構(gòu)見(jiàn)表1。模型使用生成的偽數(shù)據(jù)訓(xùn)練,從而解決對(duì)真實(shí)標(biāo)記數(shù)據(jù)的依賴。實(shí)施診斷時(shí),將目標(biāo)系統(tǒng)的數(shù)據(jù)經(jīng)過(guò)2.2節(jié)方法轉(zhuǎn)化后輸入模型,模型輸出即為故障預(yù)測(cè)類(lèi)別。矩陣數(shù)據(jù)的列數(shù)等于敏感特征的數(shù)量,而行數(shù)是截取的時(shí)間步長(zhǎng)度,通常會(huì)根據(jù)敏感特征數(shù)據(jù)選擇時(shí)間步長(zhǎng)度,使其行列數(shù)接近。
表1 深度診斷模型網(wǎng)絡(luò)結(jié)構(gòu)
Table 1
網(wǎng)絡(luò)層 | 輸出尺寸 | 參數(shù)數(shù)量 |
---|---|---|
卷積層 | (none, 9, 6, 32) | 416 |
批歸一化 | (none, 9, 6, 32) | 128 |
Dropout層 | (none, 9, 6, 32) | 0 |
卷積層 | (none, 6, 5, 64) | 16448 |
批歸一化 | (none, 6, 5, 64) | 256 |
Dropout層 | (none, 6, 5, 64) | 0 |
卷積層 | (none, 4, 4, 128) | 49280 |
批歸一化 | (none, 4, 4, 128) | 512 |
Dropout層 | (none, 4, 4, 128) | 0 |
Flatten層 | (none, 2048) | 0 |
全連接層 | (none, 128) | 262272 |
Softmax層 | (none, 6) | 774 |
新窗口打開(kāi)| 下載CSV
3 實(shí)驗(yàn)數(shù)據(jù)集與平臺(tái)
3.1 實(shí)驗(yàn)數(shù)據(jù)集
本文利用ASHRAE RP-1043數(shù)據(jù)集進(jìn)行實(shí)驗(yàn)研究[31]。ASHRAE RP-1043是美國(guó)供暖、制冷與空調(diào)工程師學(xué)會(huì)于1999年啟動(dòng)的項(xiàng)目,全名為fault detection and diagnostic (FDD) requirements and evaluation tools for chillers,旨在建立一個(gè)用于制冷系統(tǒng)故障診斷研究及方法評(píng)估的數(shù)據(jù)集,該數(shù)據(jù)集包含不同負(fù)載、不同故障條件下的制冷裝置瞬態(tài)和穩(wěn)態(tài)的運(yùn)行數(shù)據(jù)。項(xiàng)目測(cè)試系統(tǒng)為一臺(tái)制冷量為90冷噸(316.5 kW)的離心式制冷機(jī)組(圖5),使用R134a制冷工質(zhì),機(jī)組安裝在70℉(21.1℃)的恒溫室中。該數(shù)據(jù)集是一個(gè)常用的公開(kāi)數(shù)據(jù)集,以此作為實(shí)驗(yàn)數(shù)據(jù)集可以較好地驗(yàn)證提出方法的有效性。
圖5
圖5 制冷機(jī)組結(jié)構(gòu)原理圖[31]
Fig.5 Schematic diagram of chiller structure[31]
本文選擇項(xiàng)目中6類(lèi)故障和1類(lèi)健康數(shù)據(jù),每類(lèi)故障包含4種不同嚴(yán)重程度。這6類(lèi)故障分別是:冷凝器結(jié)垢(cf)、冷卻水流量減少(fwc)、冷凍水流量減少(fwe)、含非凝性氣體(nc)、制冷劑泄漏(rl)、制冷劑過(guò)充(ro)。每種故障不同嚴(yán)重程度的模擬條件見(jiàn)表2。
表2 不同嚴(yán)重程度故障的模擬條件
Table 2
故障類(lèi)別 | Level1程度 | Level2程度 | Level3程度 | Level4程度 |
---|---|---|---|---|
冷凝器結(jié)垢(cf) | 堵塞10%的換熱管 | 堵塞20%的換熱管 | 堵塞30%的換熱管 | 堵塞40%的換熱管 |
冷卻水流量減少(fwc) | 水流量減少10% | 水流量減少20% | 水流量減少30% | 水流量減少40% |
冷凍水流量減少(fwe) | 水流量減少10% | 水流量減少20% | 水流量減少30% | 水流量減少40% |
含非凝性氣體(nc) | 含1%非凝性氣體 | 含2%非凝性氣體 | 含3%非凝性氣體 | 含4%非凝性氣體 |
制冷劑泄漏(rl) | 泄漏10%制冷劑 | 泄漏20%制冷劑 | 泄漏30%制冷劑 | 泄漏40%制冷劑 |
制冷劑過(guò)充(ro) | 過(guò)充10%制冷劑 | 過(guò)充20%制冷劑 | 過(guò)充30%制冷劑 | 過(guò)充40%制冷劑 |
新窗口打開(kāi)| 下載CSV
針對(duì)這一數(shù)據(jù)集,Comstock等 [32]對(duì)其特征的敏感程度及其偏離特性進(jìn)行了研究,選定了7個(gè)關(guān)鍵特征用來(lái)表征故障,分別是:蒸發(fā)器進(jìn)出口水溫差(TEI-TEO)、冷凝器進(jìn)出口水溫差(TCO-TCI)、蒸發(fā)器壓力(PRE)、冷凝器壓力(PRC)、過(guò)冷度(TRCsub)、吸氣過(guò)熱度(Tshsuc)、排氣過(guò)熱度(Tshdis)。并建立了不同故障下特征參數(shù)的偏離矢量表(表3),這一表格就是故障偏離特性的定性知識(shí)表達(dá)。本文根據(jù)這一知識(shí)進(jìn)行診斷,而在現(xiàn)實(shí)診斷過(guò)程中亦可以通過(guò)理論推演、人為經(jīng)驗(yàn)等多種方式獲取定性知識(shí)表達(dá)。
表3 故障的多維偏離矢量
Table 3
故障類(lèi)別 | TEI-TEO | TCO-TCI | PRE | PRC | TRCsub | Tshsuc | Tshdis |
---|---|---|---|---|---|---|---|
cf | ● | ↑ | ● | ↑↑ | ● | ● | ● |
fwc | ● | ↑↑↑ | ↑ | ↑↑ | ↑↑ | ↓ | ● |
fwe | ↑↑↑ | ● | ↑ | ● | ● | ↓ | ● |
nc | ● | ↑ | ↑ | ↑↑↑ | ↑↑↑↑ | ● | ↑↑ |
rl | ● | ● | ● | ↓↓ | ↓↓↓ | ● | ● |
ro | ● | ? | ↓ | ↑↑ | ↑↑↑ | ● | ↑ |
新窗口打開(kāi)| 下載CSV
由于偏離特性的表征需要用到基準(zhǔn)模型,根據(jù)2.2節(jié)中對(duì)基準(zhǔn)模型的介紹,需要從ASHRAE RP-1043數(shù)據(jù)集中分離出用于基準(zhǔn)模型輸入輸出的變量集?;鶞?zhǔn)模型的輸出變量就是上述7個(gè)故障特征,而輸入變量應(yīng)該是系統(tǒng)的自變量,包含環(huán)境相關(guān)變量及控制相關(guān)變量,具體包括:蒸發(fā)器入水溫度、冷凝器入水溫度、交互換熱器冷凝側(cè)入水溫度、交互換熱器冷凝側(cè)出水溫度、交互換熱器蒸發(fā)側(cè)入水溫度、交互換熱器蒸發(fā)側(cè)出水溫度、外部入水溫度、外部出水溫度、熱水入水溫度、熱水出水溫度、冷凝器水流量、蒸發(fā)器水流量、小型蒸汽閥開(kāi)度、大型蒸汽閥開(kāi)度、三通閥開(kāi)度、外部水閥開(kāi)度。
3.2 算法運(yùn)行環(huán)境
深度學(xué)習(xí)算法使用Tensorflow和Python編程實(shí)現(xiàn),版本分別為2.6.0和3.9.7,開(kāi)發(fā)環(huán)境為Pycharm 2018。GPU加速算法使用CUDA11.2和cuDNN8.1支持庫(kù)。算法的運(yùn)行平臺(tái)為一臺(tái)圖形服務(wù)器,GPU是NVIDIA GeForce RTX 3080Ti,CPU是Intel i9-11900K,內(nèi)存為64 G,操作系統(tǒng)是64位Windows 10。
4 實(shí)驗(yàn)與分析
本節(jié)對(duì)前文提出方法進(jìn)行實(shí)驗(yàn)分析。首先,針對(duì)目標(biāo)系統(tǒng)訓(xùn)練基準(zhǔn)模型,進(jìn)而實(shí)現(xiàn)偏離表征,獲取后續(xù)對(duì)比實(shí)驗(yàn)所需格式的真實(shí)樣本。然后,利用MMD算法對(duì)生成樣本和真實(shí)樣本的一致性進(jìn)行評(píng)估,驗(yàn)證最優(yōu)數(shù)據(jù)生成策略。進(jìn)一步,利用生成數(shù)據(jù)訓(xùn)練診斷模型并在真實(shí)數(shù)據(jù)集上驗(yàn)證分析,得到最佳診斷策略。最后,與當(dāng)下主流的監(jiān)督學(xué)習(xí)對(duì)比,驗(yàn)證提出方法的有效性和優(yōu)勢(shì)。
4.1 目標(biāo)系統(tǒng)數(shù)據(jù)的偏離表征
目標(biāo)系統(tǒng)數(shù)據(jù)的偏離表征依賴基準(zhǔn)模型實(shí)現(xiàn),基準(zhǔn)模型的精度決定了表征的準(zhǔn)確性。參照?qǐng)D4構(gòu)建基準(zhǔn)模型,并利用目標(biāo)系統(tǒng)的健康運(yùn)行數(shù)據(jù)訓(xùn)練,使之可以良好地?cái)M合健康系統(tǒng)動(dòng)態(tài)特性。模型使用12000組樣本訓(xùn)練,每組樣本的時(shí)間步長(zhǎng)為12,并在3000組不參與訓(xùn)練的測(cè)試數(shù)據(jù)集上驗(yàn)證模型精度。模型的輸入?yún)?shù)為環(huán)境和控制相關(guān)變量,決定了系統(tǒng)的外部條件,這里使用3.1節(jié)中選定的輸入?yún)?shù)。輸出參數(shù)為熱力狀態(tài)參數(shù),是受外部條件作用下的系統(tǒng)表現(xiàn),這里選擇的是表3中的7個(gè)關(guān)鍵參數(shù)。使用Adam優(yōu)化器和MSE損失函數(shù),訓(xùn)練100輪后,測(cè)試數(shù)據(jù)集上的損失值為0.0015。在3000組健康測(cè)試樣本上進(jìn)行模型誤差計(jì)算,得到7個(gè)關(guān)鍵參數(shù)的誤差絕對(duì)均值(表4)。這里誤差均值是3000組樣本上預(yù)測(cè)值和真實(shí)值的平均偏離量,如TEI-TEO的誤差均值為0.045,代表基準(zhǔn)模型對(duì)該參數(shù)預(yù)測(cè)的平均誤差為0.045℃,可見(jiàn)預(yù)測(cè)精度已非常高,遠(yuǎn)超物理模型的預(yù)測(cè)精度。
表4 基準(zhǔn)模型的預(yù)測(cè)誤差絕對(duì)均值
Table 4
參數(shù) | 誤差均值 |
---|---|
TEI-TEO | 0.045 |
TCO-TCI | 0.043 |
PRE | 0.152 |
PRC | 0.395 |
TRCsub | 0.213 |
Tshsuc | 0.169 |
Tshdis | 0.355 |
新窗口打開(kāi)| 下載CSV
利用訓(xùn)練好的基準(zhǔn)模型對(duì)目標(biāo)系統(tǒng)的狀態(tài)值進(jìn)行預(yù)測(cè),得到目標(biāo)系統(tǒng)所處環(huán)境和控制條件下理論參數(shù)的健康基準(zhǔn)值,并與實(shí)測(cè)值進(jìn)行做差,得到偏離殘差值。進(jìn)一步去量綱化,將殘差除以表4中基準(zhǔn)模型誤差,得到偏離比例系數(shù),其數(shù)學(xué)表達(dá)見(jiàn)
式中,y表示偏離比例系數(shù);yreal表示真實(shí)值;ypre表示預(yù)測(cè)值;err表示模型誤差值。這種比例系數(shù)的形式與生成的偽數(shù)據(jù)形式一致,實(shí)質(zhì)上偽數(shù)據(jù)就是為了模擬偏離比例系數(shù)。
由于偏離比例系數(shù)通常大于1,對(duì)于一些嚴(yán)重的故障,偏離比例系數(shù)可能達(dá)到20,神經(jīng)網(wǎng)絡(luò)對(duì)這種數(shù)據(jù)不太適用,需要進(jìn)行歸一化處理。深度學(xué)習(xí)中的歸一化包括兩類(lèi):嚴(yán)格歸一化、非嚴(yán)格歸一化。利用arctan等函數(shù)將數(shù)據(jù)嚴(yán)格限制到小于1的方式屬于嚴(yán)格歸一化,這種方式適用于無(wú)法處理大于1的算法。然而,這種歸一化對(duì)數(shù)據(jù)進(jìn)行了非線性處理,使得部分?jǐn)?shù)據(jù)區(qū)間的差異被放大或縮小,給算法識(shí)別帶來(lái)難度。而非嚴(yán)格歸一化則不會(huì)強(qiáng)制限定到1以內(nèi),其處理方式更加自由。本文使用線性歸一,對(duì)所有偏離數(shù)據(jù)除以5,屬于非嚴(yán)格歸一化。系數(shù)5是根據(jù)經(jīng)驗(yàn)設(shè)定,該值與系統(tǒng)制冷量有關(guān),通常制冷量越大該值應(yīng)該越高,使處理后的數(shù)據(jù)最大值接近1。這種線性歸一可以使數(shù)據(jù)范圍更加收斂,同時(shí)最大程度保留原有數(shù)據(jù)的有效信息。
4.2 基于MMD的生成樣本一致性評(píng)估
基于隨機(jī)縮放策略的數(shù)據(jù)生成需要首先進(jìn)行多維偏離矢量的選值和縮放范圍設(shè)定。其中,多維偏離矢量選值指的是對(duì)不同偏離程度的特征賦予具體的數(shù)值,而縮放范圍設(shè)定則是限制樣本隨機(jī)縮放的上下限。這一過(guò)程需要考慮到對(duì)象實(shí)際物理情況和設(shè)計(jì)的診斷范圍。Comstock等 [32]對(duì)ASHRAE RP-1043項(xiàng)目中故障的偏離特性進(jìn)行了實(shí)驗(yàn)分析,得出了定性的偏離規(guī)律。雖然直接利用這些定性規(guī)律實(shí)現(xiàn)動(dòng)態(tài)工況故障診斷是十分困難的,但相關(guān)規(guī)律可以作為本文知識(shí)來(lái)源。而對(duì)于其他情形的診斷過(guò)程,亦可以根據(jù)對(duì)目標(biāo)系統(tǒng)的相關(guān)經(jīng)驗(yàn)設(shè)定偏離矢量選值和縮放范圍。本文參考文獻(xiàn)[32]對(duì)表3中多維偏離矢量的取值按照偏離程度分別設(shè)定,↑/↓取值為2/-2,↑↑/↓↓取值為5/-5,↑↑↑/↓↓↓取值為10/-10,↑↑↑↑/↓↓↓↓取值為20/-20,●取值為0.1,縮放范圍為0.7~3.0。
本文研究中發(fā)現(xiàn),單純利用隨機(jī)縮放生成的偽數(shù)據(jù)很難接近真實(shí)分布,這主要是由于真實(shí)系統(tǒng)具有高度復(fù)雜且不確定的特性,使得真實(shí)的殘差樣本具有較高的隨機(jī)擾動(dòng)性。針對(duì)這一特點(diǎn),本文提出對(duì)生成數(shù)據(jù)添加隨機(jī)噪聲的策略,使生成數(shù)據(jù)與真實(shí)數(shù)據(jù)一致性更佳。噪聲的添加效果與添加噪聲的幅值有密切關(guān)系,噪聲太小作用無(wú)法體現(xiàn),而噪聲太強(qiáng)會(huì)破壞數(shù)據(jù)原有結(jié)構(gòu)。接下來(lái)利用實(shí)驗(yàn)方式對(duì)不同強(qiáng)度噪聲添加以及無(wú)噪聲添加的生成數(shù)據(jù)進(jìn)行樣本一致性評(píng)估。如表5所示,對(duì)添加的標(biāo)準(zhǔn)正態(tài)分布噪聲進(jìn)行系數(shù)相除,得到不同強(qiáng)度的噪聲,同時(shí)與不添加噪聲的生成數(shù)據(jù)對(duì)比。用于評(píng)估的真實(shí)數(shù)據(jù)集包含每類(lèi)故障2000組樣本。
表5 不同策略下生成樣本和真實(shí)樣本的MMD評(píng)估
Table 5
故障類(lèi)別 | MMD值 | |||||||||
---|---|---|---|---|---|---|---|---|---|---|
無(wú)噪聲 | 噪聲/2 | 噪聲/1 | 噪聲/0.5 | 噪聲/0.25 | 噪聲/0.15 | 噪聲/0.10 | 噪聲/0.05 | 噪聲/0.025 | 噪聲/0.01 | |
正常(normal) | 0 | 0.546 | 0.216 | 0.161 | 0.216 | 0.235 | 0.233 | 0.228 | 0.225 | 0.224 |
冷凝器結(jié)垢(cf) | 0.752 | 0.643 | 0.46 | 0.228 | 0.174 | 0.205 | 0.23 | 0.233 | 0.228 | 0.225 |
冷卻水流量減少(fwc) | 0.513 | 0.52 | 0.512 | 0.483 | 0.42 | 0.319 | 0.267 | 0.207 | 0.225 | 0.231 |
冷凍水流量減少(fwe) | 0.4 | 0.396 | 0.406 | 0.352 | 0.272 | 0.202 | 0.179 | 0.205 | 0.227 | 0.229 |
含非凝性氣體(nc) | 0.55 | 0.55 | 0.528 | 0.514 | 0.448 | 0.371 | 0.318 | 0.251 | 0.256 | 0.26 |
制冷劑泄漏(rl) | 0.777 | 0.712 | 0.59 | 0.364 | 0.215 | 0.208 | 0.225 | 0.236 | 0.229 | 0.225 |
制冷劑過(guò)充(ro) | 0.578 | 0.553 | 0.546 | 0.477 | 0.325 | 0.237 | 0.207 | 0.221 | 0.235 | 0.227 |
新窗口打開(kāi)| 下載CSV
從表5可以看出,不添加噪聲的生成數(shù)據(jù)與真實(shí)數(shù)據(jù)的MMD值普遍高于添加噪聲的生成數(shù)據(jù),表示不添加噪聲的生成質(zhì)量較差。而添加噪聲的生成數(shù)據(jù)MMD值隨添加強(qiáng)度增加呈現(xiàn)先下降后上升趨勢(shì),不同故障類(lèi)別的最小MMD值對(duì)應(yīng)的噪聲強(qiáng)度不同,整體分布于2倍標(biāo)準(zhǔn)正態(tài)分布噪聲(/0.5)和20倍標(biāo)準(zhǔn)正態(tài)分布噪聲(/0.05)之間。其中,對(duì)于正常數(shù)據(jù)、cf故障以及rl故障而言,最小MMD值出現(xiàn)在更弱的噪聲添加策略處,而其他故障的最小MMD值則對(duì)應(yīng)相對(duì)較強(qiáng)的噪聲添加策略。深入分析可知,偏離程度越明顯的故障類(lèi)別適于添加更強(qiáng)的噪聲,這是因?yàn)槠渥陨淼钠x較大,更強(qiáng)的噪聲也不會(huì)對(duì)其偏離特性產(chǎn)生較大的影響。而自身偏離較小的故障則對(duì)噪聲更加敏感,太強(qiáng)的噪聲會(huì)明顯干擾其正常分布。由于MMD分布的評(píng)估并不能完全代表其最終的診斷效果,且在/0.5和/0.05添加策略之間的MMD值差異并不大,因此,最終的噪聲添加策略需要進(jìn)一步結(jié)合診斷實(shí)驗(yàn)確定。
4.3 基于知識(shí)數(shù)據(jù)化的故障診斷實(shí)驗(yàn)驗(yàn)證
本節(jié)對(duì)基于知識(shí)數(shù)據(jù)化的診斷方法進(jìn)行實(shí)驗(yàn)驗(yàn)證,驗(yàn)證數(shù)據(jù)集來(lái)自ASHRAE RP-1043,該數(shù)據(jù)集細(xì)節(jié)已在3.1節(jié)描述。本節(jié)結(jié)合4.2節(jié)實(shí)驗(yàn)結(jié)果,針對(duì)MMD值最小的5種噪聲添加策略和無(wú)噪聲添加策略進(jìn)行6組對(duì)照實(shí)驗(yàn)。診斷模型利用生成的偽數(shù)據(jù)訓(xùn)練,每種故障類(lèi)別包含3000組樣本,共計(jì)21000組樣本。其中,按照3∶1的比例分割訓(xùn)練集和驗(yàn)證集。使用Adam優(yōu)化器,批大小為128,訓(xùn)練50輪。完成訓(xùn)練的模型在真實(shí)數(shù)據(jù)集上進(jìn)行測(cè)試,測(cè)試集上每類(lèi)故障2000組樣本,結(jié)果如表6所示??梢钥闯?,添加不同強(qiáng)度噪聲的生成策略下診斷精度和MMD評(píng)估呈現(xiàn)較高的相似性。/0.15的正態(tài)分布噪聲添加下,模型的診斷精度整體上最高,而/0.15的噪聲強(qiáng)度正好是5類(lèi)添加噪聲強(qiáng)度中的中間水平,這是一種綜合效果的體現(xiàn)。同時(shí)可以發(fā)現(xiàn),在不同嚴(yán)重程度數(shù)據(jù)測(cè)試上,越嚴(yán)重的故障越容易被診斷出來(lái),越輕微的故障診斷效果越差。這應(yīng)該是由于輕微故障表征不明顯且被動(dòng)態(tài)工況波動(dòng)覆蓋,導(dǎo)致診斷難度提升。最終表明,使用標(biāo)準(zhǔn)正態(tài)分布除0.15的噪聲添加下,訓(xùn)練模型的診斷性能最佳,總體正確率可達(dá)82.67%,比不添加噪聲的診斷精度高11.64%。由于實(shí)際應(yīng)用時(shí),這類(lèi)漸變熱力故障并不需要太高的響應(yīng)速度,完全可以多次診斷后綜合決策,因此這一診斷精度已經(jīng)較好地滿足實(shí)際應(yīng)用需求。
表6 不同生成策略下故障診斷精度對(duì)比
Table 6
故障類(lèi)別 | 故障嚴(yán)重程度 | 正確率/% | |||||
---|---|---|---|---|---|---|---|
無(wú)噪聲 | 噪聲/0.5 | 噪聲/0.25 | 噪聲/0.15 | 噪聲/0.10 | 噪聲/0.05 | ||
正常(normal) | 無(wú) | 78.87 | 91.52 | 98.76 | 98.00 | 86.78 | 40.33 |
冷凝器結(jié)垢 (cf) | 堵塞10%的換熱管-Level1 | 39.32 | 43.72 | 47.84 | 53.88 | 51.71 | 51.17 |
堵塞20%的換熱管-Level2 | 59.37 | 61.04 | 64.32 | 83.32 | 69.66 | 56.69 | |
堵塞30%的換熱管-Level3 | 61.79 | 66.72 | 65.88 | 79.84 | 68.96 | 59.23 | |
堵塞40%的換熱管-Level4 | 75.04 | 70.68 | 73.00 | 83.72 | 79.54 | 58.95 | |
冷卻水流量減少 (fwc) | 水流量減少10%-Level1 | 94.11 | 82.32 | 98.92 | 99.20 | 88.06 | 80.27 |
水流量減少20%-Level2 | 93.80 | 64.52 | 99.84 | 100.0 | 100.0 | 99.64 | |
水流量減少30%-Level3 | 99.92 | 99.92 | 100.0 | 99.52 | 100.0 | 100.0 | |
水流量減少40%-Level4 | 99.65 | 100.0 | 100.0 | 99.84 | 100.0 | 100.0 | |
冷凍水流量減少 (fwe) | 水流量減少10%-Level1 | 60.32 | 73.00 | 89.28 | 65.44 | 67.05 | 52.20 |
水流量減少20%-Level2 | 80.39 | 99.52 | 99.76 | 99.80 | 99.92 | 97.69 | |
水流量減少30%-Level3 | 92.91 | 99.80 | 99.96 | 100.0 | 100.0 | 100.0 | |
水流量減少40%-Level4 | 98.20 | 100.0 | 100.0 | 100.0 | 100.0 | 100.0 | |
含非凝性氣體 (nc) | 含1%非凝性氣體-Level1 | 64.80 | 70.56 | 66.64 | 61.16 | 65.24 | 67.35 |
含2%非凝性氣體-Level2 | 68.31 | 77.60 | 79.24 | 75.08 | 72.66 | 70.45 | |
含3%非凝性氣體-Level3 | 71.80 | 78.28 | 81.12 | 72.92 | 75.59 | 73.87 | |
含4%非凝性氣體-Level4 | 80.27 | 88.24 | 97.44 | 83.76 | 94.00 | 99.19 | |
制冷劑泄漏 (rl) | 泄漏10%制冷劑-Level1 | 5.56 | 1.68 | 0.08 | 0.00 | 8.55 | 27.68 |
泄漏20%制冷劑-Level2 | 11.29 | 25.16 | 4.48 | 2.48 | 10.76 | 27.60 | |
泄漏30%制冷劑-Level3 | 71.81 | 94.36 | 98.60 | 97.48 | 97.11 | 46.43 | |
泄漏40%制冷劑-Level4 | 93.87 | 99.60 | 99.96 | 99.00 | 97.78 | 89.84 | |
制冷劑過(guò)充 (ro) | 過(guò)充10%制冷劑-Level1 | 55.19 | 39.96 | 55.16 | 88.40 | 44.72 | 24.05 |
過(guò)充20%制冷劑-Level2 | 66.24 | 51.08 | 59.36 | 91.84 | 56.69 | 28.80 | |
過(guò)充30%制冷劑-Level3 | 68.67 | 57.04 | 77.40 | 93.84 | 91.60 | 77.61 | |
過(guò)充40%制冷劑-Level4 | 60.81 | 51.44 | 76.88 | 92.12 | 88.86 | 76.91 | |
總體 | Level1 | 56.88 | 57.54 | 65.24 | 66.58 | 58.87 | 49.01 |
Level2 | 65.47 | 67.21 | 72.25 | 78.65 | 70.92 | 60.17 | |
Level3 | 77.97 | 83.95 | 88.82 | 91.66 | 88.58 | 71.07 | |
Level4 | 83.82 | 85.93 | 92.29 | 93.78 | 92.42 | 80.74 | |
Level1~Level4 | 71.03 | 73.65 | 79.65 | 82.67 | 77.70 | 65.25 |
新窗口打開(kāi)| 下載CSV
進(jìn)一步對(duì)最優(yōu)生成策略下卷積網(wǎng)絡(luò)的全連接層輸出進(jìn)行可視化處理。如圖6所示,分別利用不同嚴(yán)重程度數(shù)據(jù)進(jìn)行可視化分析,每種故障200組樣本??梢钥闯觯w上診斷模型對(duì)7個(gè)類(lèi)別可以較好聚類(lèi)和分離,但仍存在部分故障的空間分布較近,使得相互誤診率較高。如Level1中cf和rl的空間分布存在部分混疊,rl和正常數(shù)據(jù)分布接近,Level2中rl和正常數(shù)據(jù)分布十分接近,造成實(shí)際診斷中Level1的cf和rl以及Level2的rl故障診斷精度較差。這主要是由于cf和rl故障在輕微狀態(tài)下隱匿性較高,被熱力補(bǔ)償和動(dòng)態(tài)工況波動(dòng)所覆蓋,導(dǎo)致征兆不明顯。這種情形即便是監(jiān)督學(xué)習(xí)也很難達(dá)到較高的識(shí)別精度。
圖6
圖6 模型全連接層輸出特征的可視化
Fig.6 Visualization of model fully connected layer
4.4 與監(jiān)督訓(xùn)練故障診斷方法的對(duì)比分析
現(xiàn)階段智能診斷算法以數(shù)據(jù)驅(qū)動(dòng)的監(jiān)督學(xué)習(xí)模式為主。因此,有必要將監(jiān)督訓(xùn)練模型與本文方法對(duì)比研究。監(jiān)督學(xué)習(xí)算法最主要的問(wèn)題是標(biāo)記數(shù)據(jù)獲取困難,在無(wú)法獲取覆蓋全局信息的數(shù)據(jù)集時(shí),模型的適應(yīng)性存在較大局限。不同嚴(yán)重程度的故障數(shù)據(jù)分布不同,僅利用單一嚴(yán)重程度數(shù)據(jù)訓(xùn)練的模型在其他嚴(yán)重程度上會(huì)產(chǎn)生精度下降的現(xiàn)象,而實(shí)際上可能的嚴(yán)重程度是無(wú)限多的,很難獲取所有可能?chē)?yán)重程度的標(biāo)記數(shù)據(jù)。本文針對(duì)這一現(xiàn)實(shí)問(wèn)題,對(duì)比不同訓(xùn)練數(shù)據(jù)下的監(jiān)督學(xué)習(xí)方法和本文提出方法的診斷精度和自適應(yīng)性,驗(yàn)證本文方法的優(yōu)勢(shì)。
本節(jié)設(shè)置6組對(duì)比實(shí)驗(yàn),分別是本文提出的知識(shí)數(shù)據(jù)化方法和利用Level1、Level2、Level3、Level4以及Level1~Level4全部數(shù)據(jù)作為訓(xùn)練樣本的監(jiān)督學(xué)習(xí)方法。模型的結(jié)構(gòu)設(shè)計(jì)和表2相同,每類(lèi)故障使用2000組樣本,使用Adam優(yōu)化器,批大小為128,訓(xùn)練50輪。
圖7展示了對(duì)比結(jié)果。從總體精度上來(lái)看,利用知識(shí)數(shù)據(jù)化表達(dá)的診斷精度為82.7%,這一結(jié)果比使用全部數(shù)據(jù)訓(xùn)練模型的88.2%差,這是很容易理解的,當(dāng)數(shù)據(jù)充足時(shí)監(jiān)督學(xué)習(xí)的效果理應(yīng)最好,本文重點(diǎn)對(duì)比標(biāo)記數(shù)據(jù)不充足的情況。從前5組對(duì)比實(shí)驗(yàn)來(lái)看,本文提出的方法僅次于利用Level2數(shù)據(jù)集訓(xùn)練的模型,診斷正確率低0.8%,而相比于其他3組實(shí)驗(yàn)的正確率分別高出2.8%、5.9%、20.3%。進(jìn)一步分析診斷方法在不同嚴(yán)重程度上的適應(yīng)性。本文提出方法和4組單一嚴(yán)重程度數(shù)據(jù)訓(xùn)練方法在不同嚴(yán)重程度驗(yàn)證集上的最優(yōu)診斷正確率分別為:93.8%、83.6%、93.0%、92.8%、95.5%,而最優(yōu)最差正確率的差值分別為:27.2%、9.1%、19.7%、42.8%、70.1%。綜合可以看出,對(duì)比4組監(jiān)督學(xué)習(xí),本文提出的方法在最優(yōu)診斷和最優(yōu)最差差值上均處于中間水平,結(jié)合該方法完全無(wú)須標(biāo)記數(shù)據(jù)的特性,表明該方法具有替代監(jiān)督學(xué)習(xí)算法的潛力,具有明顯優(yōu)勢(shì)。
圖7
圖7 與監(jiān)督學(xué)習(xí)的診斷精度對(duì)比
Fig.7 Comparison of diagnosis accuracy with supervised learning
5 結(jié)論
本文提出一種基于知識(shí)數(shù)據(jù)化表達(dá)的制冷空調(diào)系統(tǒng)故障診斷方法,通過(guò)將故障特征偏離的先驗(yàn)知識(shí)轉(zhuǎn)化為數(shù)據(jù),解決現(xiàn)有監(jiān)督學(xué)習(xí)算法過(guò)度依賴標(biāo)記數(shù)據(jù)的問(wèn)題。同時(shí),針對(duì)目標(biāo)系統(tǒng)運(yùn)行數(shù)據(jù),提出一種基于基準(zhǔn)模型的數(shù)據(jù)偏離特性表征方法,將數(shù)據(jù)的偏離特性提取出來(lái),使之適應(yīng)于生成數(shù)據(jù)的形式統(tǒng)一,從而適應(yīng)于生成數(shù)據(jù)訓(xùn)練的模型。具體結(jié)論如下。
(1)提出一種隨機(jī)縮放策略用于將知識(shí)轉(zhuǎn)化為數(shù)據(jù)形式并實(shí)現(xiàn)信息擴(kuò)增,其中,提出一種生成數(shù)據(jù)的噪聲添加策略,通過(guò)添加不同強(qiáng)度的高斯噪聲實(shí)現(xiàn)生成分布和真實(shí)分布的拉近。實(shí)驗(yàn)表明,添加噪聲的確會(huì)優(yōu)化生成分布和真實(shí)分布的距離,且隨著噪聲添加強(qiáng)度的增加,分布距離呈現(xiàn)先變小后變大的趨勢(shì)。同時(shí),噪聲添加強(qiáng)度受到故障自身偏離程度的影響,偏離越明顯的故障越應(yīng)添加高強(qiáng)度噪聲。
(2)從故障診斷實(shí)驗(yàn)驗(yàn)證可知,添加噪聲可以明顯提升最終診斷精度,且不同噪聲強(qiáng)度對(duì)診斷的影響不同,其隨著噪聲添加強(qiáng)度增加,診斷精度呈現(xiàn)先提升后降低的趨勢(shì),其結(jié)論與MMD評(píng)估結(jié)論基本一致。不同噪聲添加強(qiáng)度中,添加/0.15標(biāo)準(zhǔn)正態(tài)分布噪聲數(shù)據(jù)后,診斷的整體精度最佳,最優(yōu)的總體診斷精度可達(dá)82.67%,比不添加噪聲的診斷精度高11.64%。
(3)與4組單一嚴(yán)重程度數(shù)據(jù)監(jiān)督訓(xùn)練方法對(duì)比,本文提出方法僅比使用Level2數(shù)據(jù)訓(xùn)練方法的正確率低0.8%,而比其他3組實(shí)驗(yàn)的正確率分別高出2.8%、5.9%、20.3%。在4個(gè)嚴(yán)重程度分別驗(yàn)證實(shí)驗(yàn)中可以看出,本文提出方法無(wú)論是在最優(yōu)診斷率還是最優(yōu)最差的正確率差值上均處于中間水平。結(jié)合本文方法完全無(wú)須標(biāo)記數(shù)據(jù)的特性,其優(yōu)勢(shì)明顯。
綜上,本文提出的知識(shí)數(shù)據(jù)化表達(dá)方法較好地解決了監(jiān)督學(xué)習(xí)對(duì)標(biāo)記數(shù)據(jù)的依賴,同時(shí)保持了較高的診斷精度,在制冷空調(diào)故障診斷領(lǐng)域具有廣闊的應(yīng)用前景。然而,該方法仍然具有一定不足之處。在方法層面上,利用噪聲添加雖然一定程度上模擬了真實(shí)系統(tǒng)的隨機(jī)特性,然而熱力系統(tǒng)具有時(shí)序特點(diǎn),隨機(jī)性仍然遵循一定時(shí)序規(guī)律,因此在隨機(jī)信息模擬方面如果可以將真實(shí)系統(tǒng)時(shí)序性考慮進(jìn)去,則可以使生成分布與真實(shí)分布更加接近;在應(yīng)用層面上,該方法以典型故障偏離知識(shí)為基礎(chǔ),因而針對(duì)微弱、早期、隱性故障的診斷精度不高,主要是由于這類(lèi)故障征兆不明顯,需要更加復(fù)雜的知識(shí)作為依據(jù),后續(xù)研究中應(yīng)該更加豐富先驗(yàn)知識(shí)的形式,不僅包含定性偏離,還應(yīng)包含參數(shù)間相互映射關(guān)系等信息。在知識(shí)獲取層面上,要研究更加多樣的獲取方式,包括數(shù)值仿真系統(tǒng)、實(shí)驗(yàn)系統(tǒng)、理論推導(dǎo)、相似系統(tǒng)知識(shí)遷移等多種手段,充分發(fā)揮領(lǐng)域?qū)<抑R(shí)優(yōu)勢(shì),將其作為重要指導(dǎo)依據(jù)。如果可以解決上述問(wèn)題,則該方法的應(yīng)用場(chǎng)景將會(huì)進(jìn)一步拓寬。
欄目分類(lèi)
- 1網(wǎng)絡(luò)直播現(xiàn)狀及前景探究
- 2淺析電影《我的父親母親》視聽(tīng)語(yǔ)言特色——影視文學(xué)
- 3中美貿(mào)易戰(zhàn)的發(fā)展和應(yīng)對(duì)
- 4論微信傳播的特點(diǎn)
- 5企業(yè)如何進(jìn)行危機(jī)公關(guān)——以三星Galaxy note7爆炸門(mén)事件為例
- 6淺析網(wǎng)絡(luò)暴力的社會(huì)危害及防治對(duì)策
- 7聚酮類(lèi)化合物研究進(jìn)展
- 8淺析《極限挑戰(zhàn)》的節(jié)目特色及啟示
- 9《楚門(mén)的世界》的多重隱喻解讀
- 10體育產(chǎn)業(yè)發(fā)展中存在的問(wèn)題及建議
- 游戲教學(xué)法在網(wǎng)球教學(xué)中的應(yīng)用
- 心理素質(zhì)在網(wǎng)球比賽中的作用
- 綠色科技視角下企業(yè)環(huán)境績(jī)效指標(biāo)體系構(gòu)建
- 節(jié)約型基礎(chǔ)上的綠色財(cái)政稅收政策研究
- 財(cái)政投資項(xiàng)目竣工決算存在的問(wèn)題及對(duì)策
- 基于精細(xì)化管理視域探析公立醫(yī)院成本管控優(yōu)化策略
- 農(nóng)村信用社在金融市場(chǎng)中的營(yíng)銷(xiāo)技巧探究
- 實(shí)現(xiàn)我國(guó)糧食增產(chǎn)增收的財(cái)稅政策分析
- 離子色譜法同時(shí)測(cè)定卷煙紙中幾種金屬離子的含量
- IC厭氧反應(yīng)器處理造紙廢水效率的時(shí)間分布特征研究
- 2025年中科院分區(qū)表已公布!Scientific Reports降至三區(qū)
- 2023JCR影響因子正式公布!
- 國(guó)內(nèi)核心期刊分級(jí)情況概覽及說(shuō)明!本篇適用人群:需要發(fā)南核、北核、CSCD、科核、AMI、SCD、RCCSE期刊的學(xué)者
- 我用了一個(gè)很復(fù)雜的圖,幫你們解釋下“23版最新北大核心目錄有效期問(wèn)題”。
- CSSCI官方早就公布了最新南核目錄,有心的人已經(jīng)拿到并且投入使用!附南核目錄新增期刊!
- 北大核心期刊目錄換屆,我們應(yīng)該熟知的10個(gè)知識(shí)點(diǎn)。
- 注意,最新期刊論文格式標(biāo)準(zhǔn)已發(fā)布,論文寫(xiě)作規(guī)則發(fā)生重大變化!文字版GB/T 7713.2—2022 學(xué)術(shù)論文編寫(xiě)規(guī)則
- 盤(pán)點(diǎn)那些評(píng)職稱超管用的資源,1,3和5已經(jīng)“絕種”了
- 職稱話題| 為什么黨校更認(rèn)可省市級(jí)黨報(bào)?是否有什么說(shuō)據(jù)?還有哪些機(jī)構(gòu)認(rèn)可黨報(bào)?
- 《農(nóng)業(yè)經(jīng)濟(jì)》論文投稿解析,難度指數(shù)四顆星,附好發(fā)選題!