優(yōu)勝?gòu)倪x擇開始,我們是您最好的選擇!—— 中州期刊聯(lián)盟(新鄉(xiāng)市博翰文化傳媒有限公司)
0373-5939925
2851259250@qq.com
我要檢測(cè) 我要投稿 合法期刊查詢

基于熱擴(kuò)散核密度確定密度峰值法的歷史工況識(shí)別

作者:畢榮山 韓智慧 陶少輝 孫曉巖 項(xiàng)曙光來源:《化工學(xué)報(bào)》日期:2022-05-19人氣:637

引 言

近年來,隨著物聯(lián)網(wǎng)、大數(shù)據(jù)和人工智能等技術(shù)的興起,數(shù)據(jù)驅(qū)動(dòng)的方法在工業(yè)智能化的進(jìn)程中扮演著重要角色。在實(shí)際生產(chǎn)過程中,原料性質(zhì)、生產(chǎn)方案或操作條件等因素的變動(dòng)將導(dǎo)致生產(chǎn)過程的多模態(tài)化[1],如發(fā)酵過程[2]、冶金過程和鍋爐燃燒過程等,對(duì)其過程進(jìn)行數(shù)字化時(shí)往往存在著非線性、多模態(tài)和變量間的強(qiáng)相關(guān)性等問題[3-4]。因此,深入研究多模態(tài)過程的特點(diǎn)對(duì)實(shí)際生產(chǎn)有著重要作用。通過獲取歷史工況特征,不僅可以為當(dāng)前裝置選擇合適的工況模型及參數(shù)進(jìn)行優(yōu)化,也能為生產(chǎn)決策提供重要的數(shù)據(jù)參考,如污水處理裝置的智能優(yōu)化、管道泄漏的自動(dòng)化檢測(cè)和生產(chǎn)運(yùn)行狀況的有效評(píng)估[5-6]等。

在對(duì)多模態(tài)過程的研究中,由于不同工況間存在著較大的差異,研究者通常假設(shè)每種工況下的過程數(shù)據(jù)近似服從一種高斯分布,運(yùn)用主成分分析(PCA)、偏最小二乘(PLS)、獨(dú)立成分分析(ICA)和支持向量數(shù)據(jù)描述(SVDD)模型等方法提取工況數(shù)據(jù)的特征,然后建立模型應(yīng)用于過程故障檢測(cè)、過程控制和過程優(yōu)化等[7-10]。由于每種工況下的數(shù)據(jù)具有相似性,有學(xué)者將數(shù)據(jù)聚類的方法用于多模態(tài)過程的特征提取[11]。常用的聚類方法包括模糊C均值法[12]、K-均值法[13]、高斯混合模型(GMM)[14-15]和隱馬爾可夫模型(HMM)[16]等,這些方法在獲取數(shù)據(jù)特征時(shí)具有一定的有效性,但仍存在一些無法避免的缺陷。如K-均值法需要事先確定聚類數(shù)量,對(duì)數(shù)據(jù)中的噪聲點(diǎn)敏感;模糊C均值法存在聚類數(shù)量和參數(shù)選取的問題;HMM模型需要事先知道各種模態(tài)的概率且固定不變;GMM模型在使用期望最大法求解時(shí),存在計(jì)算量較大、對(duì)模型參數(shù)的初值敏感和容易陷入局部極值等問題,這些缺點(diǎn)都將導(dǎo)致無法準(zhǔn)確地識(shí)別工況[17-18]。有學(xué)者對(duì)GMM模型進(jìn)行深入研究,提出了給定模型參數(shù)初值[19]和基于信息準(zhǔn)則確定聚類數(shù)量[20]的方法,其中F-J的方法較為著名[21-22],它通過在迭代計(jì)算中不斷剔除冗余的高斯分量得出聚類結(jié)果,但是該方法需要一個(gè)較大的聚類數(shù)量導(dǎo)致計(jì)算量大且收斂困難,其結(jié)果的準(zhǔn)確性也不能保證。

快速搜索發(fā)現(xiàn)密度峰[23](CFSFDP)是基于局部密度的一種聚類技術(shù),它根據(jù)聚類中心點(diǎn)密度較大且與其他中心點(diǎn)距離較遠(yuǎn)的特點(diǎn),引入高斯核密度估計(jì)函數(shù)(KDE)計(jì)算數(shù)據(jù)點(diǎn)的密度,再通過歐氏距離計(jì)算數(shù)據(jù)點(diǎn)間的距離,從而完成數(shù)據(jù)聚類。但是該方法的聚類效果取決于截距參數(shù),為避免這一點(diǎn),有學(xué)者對(duì)其進(jìn)行改進(jìn)并提出了無須事先確定截距參數(shù)的熱擴(kuò)散核密度確定密度峰的技術(shù)[24](CFSFDP-HD)。本文提出將CFSFDP-HD技術(shù)與GMM模型結(jié)合的方法,首先通過CFSFDP-HD方法對(duì)多模態(tài)過程數(shù)據(jù)進(jìn)行聚類,然后將聚類結(jié)果作為GMM模型的初值,從而對(duì)多模態(tài)過程的工況進(jìn)行較準(zhǔn)確的估計(jì)。

1 工況識(shí)別方法

1.1 高斯混合模型

過程數(shù)據(jù) X n×d 是d維的n個(gè)樣本數(shù)據(jù),且X={x1,x2,?,xn}X=x1,x2,?,xn,其概率密度函數(shù)可表示為:

p(x|θ)=∑i=1kτig(x|θi)px|θ=i=1kτigx|θi(1)

其中,k為高斯模型的數(shù)量,τi 和θi={μi,Σi}θi=μi,Σi分別為第i個(gè)高斯模型的權(quán)重和參數(shù)(平均值和協(xié)方差)。

i個(gè)高斯模型對(duì)應(yīng)的高斯密度函數(shù)為:

g(x|θi)=1(2π)d/2|Σi|1/2exp[?12(x?μi)TΣ?1i(x?μi)]                         (i=1,2,?,k)gx|θi=12πd/2Σi1/2exp-12x-μiΤΣi-1x-μi                         i=1,2,?,k(2)

模型的參數(shù)θi 常用EM法[25]求解,通過不斷地更新后驗(yàn)概率和模型參數(shù),直到模型參數(shù)幾乎不變。針對(duì)數(shù)據(jù)X={x1,x2,?,xn}X=x1,x2,?,xn和模型初始參數(shù)θ(0)={{τ(0)1,θ(0)1},{τ(0)2,θ(0)2},…,{τ(0)k,θ(0)k}}θ0=τ10,θ10,τ20,θ20,,τk0,θk0,其迭代計(jì)算步驟如下。

E步驟:

P(s)(Ck|xj)=τ(s)kg(xj|μ(s)k,Σ(s)k)∑i=1kτ(s)ig(xj|μ(s)i,Σ(s)i)         (j=1,2,?,n)P(s)Ck|xj=τksgxj|μks,Σksi=1kτisgxj|μis,Σis         j=1,2,?,n(3)

P(s)(Ck|xj)PsCk|xj表示第j個(gè)樣本屬于第k個(gè)高斯模型的后驗(yàn)概率,s表示第s次迭代。

M步驟:

μ(s+1)k=∑j=1nP(s)(Ck|xj)xj∑j=1nP(s)(Ck|xj)μks+1=j=1nPsCk|xjxjj=1nPsCk|xj(4)Σ(s+1)k=∑j=1nP(s)(Ck|xj)(xj?μ(s+1)k)(xj?μ(s+1)k)T∑j=1nP(s)(Ck|xj)Σks+1=j=1nPsCk|xjxj-μks+1xj-μks+1Τj=1nPsCk|xj(5)τ(s+1)k=∑j=1nP(s)(Ck|xj)nτks+1=j=1nPsCk|xjn(6)

其中,μ(s+1)k、Σ(s+1)k、τ(s+1)kμks+1、Σks+1τks+1分別為第k個(gè)高斯模型在第(s+1)次迭代的平均值、協(xié)方差矩陣和先驗(yàn)概率。

基于最短信息長(zhǎng)度準(zhǔn)則的F-J方法只需對(duì)式(6)進(jìn)行如下修改,即可得到較為理想的聚類結(jié)果。

τ(s+1)k=max{0,(∑j=1nP(s)(Ck|xj))?v2}∑i=1kmax{0,(∑j=1nP(s)(Ck|xj))?v2}τks+1=max0,j=1nPsCk|xj-v2i=1kmax0,j=1nPsCk|xj-v2(7)

其中,v=12d2+32dv=12d2+32dd為變量的個(gè)數(shù),通過迭代將任意兩個(gè)相同的高斯模型進(jìn)行合并,最終獲得多個(gè)工況模型及其參數(shù)。

1.2 熱擴(kuò)散核密度確定密度峰技術(shù)

基于熱擴(kuò)散的高斯核函數(shù)為:

P(di,dj,t)=1n∑j=1n12πt√e?(di?dj)22tPdi,dj,t=1nj=1n12πte-di-dj22t (j =1,2,…,n(8)

P(di,dj,t)Pdi,dj,t為樣本點(diǎn)ij的轉(zhuǎn)移概率,t為核函數(shù)的帶寬,di - dj 為樣本ji的距離。

估算任意樣本點(diǎn)i的概率密度函數(shù)為:

ρi=f?(d;t)≈∑k=0n?1αke?k2π2t/2cos(kπd)ρi=f?d;tk=0n-1αke-k2π2t/2coskπd(9)

式(9)為KDE的完全自適應(yīng)形式,考慮了最佳帶寬選擇和邊界校正。其中n為一個(gè)較大的整數(shù),本文取n為樣本數(shù)量,αk 為:

αk=???????1,k=01n∑i=1ncos(kπdi),k=1,2,?,n?1αk=1,k=01ni=1ncoskπdi,k=1,2,?,n-1(10)

最佳帶寬的選擇使用了改進(jìn)的Sheather–Jones(ISJ)方法[26],其計(jì)算步驟如下:

t=ξγ[l](t)t=ξγlt(11)ξ=62√?37ξ=62-37(12)γ[l](t)=γ1(γ2(?γl(t)?))γlt=γ1γ2?γlt?(13)γ[l](t)=1+0.5(l+0.5)31×3×?×(2l?1)nπ/2√∥∥f(l+1)∥∥2γlt=1+0.5l+0.531×3×?×2l-1nπ/2fl+12(14)∥∥f(l+1)∥∥2=∑k=1l?1(kπ)(2l+2)α2kexp(?(kπ)2t)fl+12=k=1l-1kπ2l+2αk2exp-kπ2t(15)

其中,當(dāng)l ≥ 5時(shí),l的取值對(duì)式(11)的計(jì)算結(jié)果影響很小,故本文中取l = 5。

帶寬t的詳細(xì)求解步驟如下:

(1)設(shè)置一個(gè)較小的容差ε = 10-9,令yq=εq = 0;

(2)計(jì)算yq+1=ξγ[l](yq)yq+1=ξγlyq

(3)如果∣∣yq+1?yq∣∣<εyq+1-yq<ε,t = yq+1停止,否則yq = yq+1,q = q +1,返回步驟(2)。另外,令t = sqrt(t)/3.3,可對(duì)邊界點(diǎn)進(jìn)行修正。

計(jì)算每一樣本點(diǎn)i到最近的高密度點(diǎn)j的距離:

δ={min(dij), if ? j, ρj>ρimax(dij), otherwiseδ=mindij, if ? j, ρj>ρimaxdij, otherwise(16)

1.3 提出方法的計(jì)算步驟

本文提出的方法對(duì)近似服從高斯分布的未知多模態(tài)穩(wěn)態(tài)工況進(jìn)行識(shí)別時(shí),首先利用CFSFDP-HD技術(shù)對(duì)多模態(tài)過程數(shù)據(jù)進(jìn)行聚類,確定聚類中心點(diǎn)及其個(gè)數(shù)(即工況個(gè)數(shù)),然后將每一類數(shù)據(jù)的平均值和協(xié)方差作為GMM模型的初值,迭代求出不同工況的特征參數(shù)。其計(jì)算過程如下:

(1)將數(shù)據(jù)標(biāo)準(zhǔn)化處理,求取參數(shù)αk;

(2)由參數(shù)αk 和式(11)~式(15)得出最佳帶寬t;

(3)由式(9)和式(16)的結(jié)果畫出決策圖,并由此完成聚類;

(4)將每一類的特征參數(shù)作為GMM模型初值,求出最終工況參數(shù)。

通過以上步驟即可完成對(duì)歷史工況的準(zhǔn)確識(shí)別,下面通過第2節(jié)中的兩個(gè)例子對(duì)該方法進(jìn)行驗(yàn)證。

圖1

圖1   基于熱擴(kuò)散核密度的工況識(shí)別方法流程圖

Fig.1   Flow chart of recognizing operating modes based on kernel density estimation of heat diffusion


2 方法驗(yàn)證與結(jié)果分析

2.1 仿真數(shù)據(jù)

根據(jù)文獻(xiàn)[27]中的多模態(tài)仿真模型生成過程數(shù)據(jù),然后分別用本文提出的方法、K-均值法和GMM(F-J)的方法進(jìn)行工況識(shí)別,數(shù)據(jù)生成模型如式(17)所示:

?????x1=0.5768s1+0.3766s2+e1x2=0.7382s21+0.0566s2+e2x3=0.8291s1+0.4009s22+e3x1=0.5768s1+0.3766s2+e1x2=0.7382s12+0.0566s2+e2x3=0.8291s1+0.4009s22+e3(17)x?i=xi,j?xi,minxi,max?xi,minx?i=xi,j-xi,minxi,max-xi,min(18)

式(18)為數(shù)據(jù)標(biāo)準(zhǔn)化的方法,xi,j 表示第i個(gè)變量的第j個(gè)數(shù)據(jù),x?ix?i表示標(biāo)準(zhǔn)化處理后的第i個(gè)變量的向量數(shù)據(jù),xi,min表示第i個(gè)變量的最小值,xi,max表示第i個(gè)變量的最大值。

其中,e1~e3是服從[0,0.01]的高斯白噪聲分布,通過調(diào)整s1和s2的參數(shù),生成含3個(gè)變量(x1、x2和x3)的多模態(tài)過程數(shù)據(jù)。其中模態(tài)1是變量s1和s2分別服從高斯分布為[20,0.8]、[1,1.3]得到的300個(gè)數(shù)據(jù);模態(tài)2是變量s1和s2分別服從高斯分布[5,0.6]、[20,0.7]得到的300個(gè)數(shù)據(jù);模態(tài)3是變量s1和s2分別服從高斯分布[16,1.5]、[20,0.7]得到的300個(gè)數(shù)據(jù);模態(tài)4是和模態(tài)2在相同參數(shù)(工況)下產(chǎn)生的300個(gè)數(shù)據(jù),用于檢驗(yàn)三種方法能否準(zhǔn)確地獲取實(shí)際的工況狀態(tài)。

將生成數(shù)據(jù)用式(18)進(jìn)行標(biāo)準(zhǔn)化處理,其分布情況如圖2所示,可以看出數(shù)據(jù)有四個(gè)階段,其中300~600和900~1200階段的狀態(tài)相同,然后分別對(duì)三種方法進(jìn)行驗(yàn)證。使用本文方法畫出關(guān)于密度和距離的決策圖,見圖3,圖中有三個(gè)中心點(diǎn),表明本文方法根據(jù)過程數(shù)據(jù)識(shí)別出三種工況,每個(gè)中心點(diǎn)表示一種工況的數(shù)據(jù)中心。然后根據(jù)數(shù)據(jù)點(diǎn)到中心點(diǎn)的距離將其分類,將每一類的結(jié)果作為GMM模型的初值,從而得出不同工況的特征參數(shù)。使用K-均值法進(jìn)行工況識(shí)別時(shí),由于聚類數(shù)量是未知的,所以將聚類數(shù)量分別設(shè)置為3、4和5,其中K = 5時(shí)的結(jié)果與實(shí)際相差較大,其結(jié)果未在表1中列出。使用GMM(F-J)方法時(shí),需要設(shè)置初始聚類數(shù)量(K)大于實(shí)際工況數(shù)量,本文分別設(shè)為4、5和6,GMM模型的初值設(shè)置為將過程數(shù)據(jù)平均分成K份,每份數(shù)據(jù)的特征參數(shù)[19],先驗(yàn)概率設(shè)為1/K,其中K = 6時(shí)的結(jié)果與K = 5時(shí)的結(jié)果幾乎相同,其結(jié)果未在表1中列出。三種方法的工況識(shí)別結(jié)果見表1??梢钥闯霰疚姆椒ǐ@取的多模態(tài)過程的工況個(gè)數(shù)及其特征參數(shù)(變量的平均值和工況的先驗(yàn)概率)與實(shí)際值一致。當(dāng)K-均值法的聚類數(shù)量與實(shí)際工況數(shù)量一致時(shí)(K=3),得到的工況特征參數(shù)與實(shí)際值的相對(duì)偏差較小,當(dāng)聚類數(shù)量大于實(shí)際工況數(shù)量時(shí)(K=4),得到的工況特征參數(shù)與實(shí)際值的相對(duì)偏差較大,由此看出該方法的工況識(shí)別效果取決于聚類數(shù)量的準(zhǔn)確選擇。GMM(F-J)方法給定不同的初始聚類數(shù)量(K=4、5)時(shí)均將工況識(shí)別為4種,未能準(zhǔn)確識(shí)別出實(shí)際工況的個(gè)數(shù),但得到的工況特征參數(shù)與實(shí)際值的偏差在0.01~-20.39,其結(jié)果仍具有一定的參考價(jià)值。

圖2

圖2   仿真多模態(tài)過程數(shù)據(jù)標(biāo)準(zhǔn)化

Fig.2   Normalization of multi-modal process simulation data


圖3

圖3   仿真多模態(tài)過程數(shù)據(jù)的聚類中心決策圖

Fig.3   Clustering center decision diagram of process data for simulating multiple operating modes


表1   仿真多模態(tài)過程的工況識(shí)別結(jié)果

Table 1  Recognition results of simulation multiple operating modes

項(xiàng)目工況個(gè)數(shù)每種工況的先驗(yàn)概率每種工況下變量x1, x2, x3的平均值相對(duì)偏差
實(shí)際值30.2511.777,296.288,12.410
0.2520.467,192.899,354.307

0.510.351,19.900,152.718

本文方法30.2511.777,296.288,12.4100,0,0
0.2520.467,192.899,354.3070,0,0

0.510.351,19.900,152.7180,0,0

K-均值法

K = 3)

30.2511.777,296.288,12.4100,0,0
0.2520.467,192.899,354.3070,0,0

0.510.351,19.900,152.7180,0,0

K-均值法

K = 4)

40.2511.777,296.288,12.4100,0,0
0.13621.4211,209.428,388.0634.66,8.57,9.53

0.11419.3326,173.233,314.1445.54,10.2,11.34

0.510.3508,19.900,152.7180,0,0

GMM(F-J)法

K = 4)

40.2511.777,296.288,12.4100,0,0
0.20310.0372,15.8427,152.52-2.84,-19.7,0.01

0.2520.467,192.899,354.3070,0,0

0.29710.5662,22.6857,152.8531.88,13.03,-0.05

GMM(F-J)法

K = 5)

40.2511.777,296.288,12.4100,0,0
0.20310.0372,15.8426,152.52-3.03,-20.39,-0.13

0.2520.467,192.899,354.3070,0,0

0.29710.5662,22.6857,152.8532.08,14,0.09



2.2 TE過程

Tennessee Eastman(TE)工業(yè)過程是由美國(guó)Eastman化學(xué)品公司開發(fā)的復(fù)雜工業(yè)過程的仿真平臺(tái),它包括六種工作模態(tài),每種模態(tài)具有不同的產(chǎn)品比例(G/H),該流程包含12個(gè)操作變量、22個(gè)連續(xù)過程測(cè)量變量和19個(gè)組成測(cè)量變量[28-30]。本文選取TE過程中模態(tài)1~模態(tài)4作為多模態(tài)過程,選取41個(gè)測(cè)量變量作為工況識(shí)別的變量,其中每種模態(tài)取300個(gè)數(shù)據(jù)為1組,第5組和第3組為相同模態(tài)下的數(shù)據(jù),具體模態(tài)選取情況見表2

表2   TE過程的模態(tài)選取情況

Table 2  Mode selection of the TE process

項(xiàng)目模態(tài)G/H比例產(chǎn)品生產(chǎn)率
第1組150/507038 kg/h G和7038 kg/h H
第2組210/901048 kg/h G和12669 kg/h H
第3組390/1010000 kg/h G 和1111 kg/h H
第4組450/50最大生產(chǎn)率
第5組390/1010000 kg/h G 和1111 kg/h H



將過程數(shù)據(jù)用式(18)進(jìn)行標(biāo)準(zhǔn)化處理,選取反應(yīng)器溫度、A和C的混合進(jìn)料量、產(chǎn)品分離器壓力和回收流量4個(gè)變量畫出分布圖,見圖4,可以看出5個(gè)階段中600~900和1200~1500的狀態(tài)相同,然后分別用三種方法進(jìn)行驗(yàn)證。本文方法得到的決策圖見圖5,圖中有4個(gè)中心點(diǎn),表明本文方法識(shí)別出4種工況,然后使用GMM法獲取每種工況的特征參數(shù)。將K-均值法的聚類數(shù)量(K)分別設(shè)為4、5和6,其中K = 5和6的結(jié)果與實(shí)際相差較大,其結(jié)果未在表4中列出。將GMM(F-J)方法的初始聚類數(shù)量設(shè)為4、5和6時(shí),該方法均無法獲取工況參數(shù)。三種方法工況識(shí)別結(jié)果的典型數(shù)據(jù)見表3、表4。

圖4

圖4   4個(gè)TE過程變量的標(biāo)準(zhǔn)化

Fig.4   Normalization of 4 TE process variables


圖5

圖5   TE多模態(tài)過程數(shù)據(jù)的聚類中心決策圖

Fig.5   Clustering center decision diagram of TE multi-modal process


表3   TE多模態(tài)過程的工況個(gè)數(shù)及先驗(yàn)概率的識(shí)別結(jié)果

Table 3  Recognition results of the number and probability of the TE multi-modal process

項(xiàng)目實(shí)際值本文方法K-均值法(K = 4)K-均值法(K = 5)K-均值法(K = 6)GMM(F-J)法(K ≥ 4)
工況個(gè)數(shù)44456無法得到參數(shù)
每種工況的先驗(yàn)概率0.20.20.20.20.06無法得到參數(shù)
0.20.20.20.20.08

0.40.40.40.1060.06

0.20.20.20.0940.2




0.40.4





0.2



表4   TE多模態(tài)過程變量的識(shí)別結(jié)果

Table 4  Recognition results of TE multi-modal process variables

變量本文方法K-均值法(K = 4)



平均相對(duì)偏差最大相對(duì)偏差最小相對(duì)偏差平均相對(duì)偏差最大相對(duì)偏差最小相對(duì)偏差
D物料流量-0.081-0.4104-0.0225-0.0814-0.412-0.0225
回收流量0.09120.27860.00620.09090.27780.0062
放空率-1.3681-4.748-0.9476-1.4371-4.9847-0.9567
反應(yīng)器進(jìn)料量0.06450.15050.03570.06440.15030.0357
產(chǎn)品分離器壓力-0.0043-0.0148-0.0014-0.0043-0.0148-0.0014
汽提塔溫度0.01890.23430.06130.01860.23370.0613
壓縮機(jī)工作功率0.10750.32170.04410.10710.32070.0441
反應(yīng)器組分B流量-0.1046-0.4776-0.1074-0.1054-0.4799-0.1075
放空氣體中G組分流量-0.0142-0.93560.1306-0.0173-0.94440.1305
產(chǎn)品中組分H流量-0.04240.46180.1825-0.04380.45970.1821



表3可以看出本文方法得到的歷史工況的個(gè)數(shù)和先驗(yàn)概率與實(shí)際值一致;K-均值法的結(jié)果則取決于設(shè)定的聚類數(shù)量K,當(dāng)K與實(shí)際一致(K = 4)時(shí)也可以較準(zhǔn)確獲取歷史工況的個(gè)數(shù)及先驗(yàn)概率,但是當(dāng)K = 5和K = 6時(shí),其結(jié)果與實(shí)際相差較大。GMM(F-J)法則無法獲取到工況的參數(shù)。

三種方法過程變量的識(shí)別結(jié)果見表4,可以看出本文提出的方法識(shí)別結(jié)果的平均相對(duì)偏差在 -0.0043~-1.3681,最大相對(duì)偏差為-4.748,最小相對(duì)偏差為-0.0014;K-均值法識(shí)別結(jié)果的平均相對(duì)偏差在-0.0043~-1.4371,最大相對(duì)偏差為-4.9847,最小相對(duì)偏差為-0.0014。結(jié)合表3、表4可以看出GMM(F-J)法不適合本案例的工況識(shí)別,本文方法和給定準(zhǔn)確聚類數(shù)量的K-均值法都可以較準(zhǔn)確地識(shí)別出工況特征,但K-均值法的準(zhǔn)確性依賴于聚類數(shù)量的選擇,而本文方法則沒有這種約束。

3 結(jié) 論

針對(duì)目前工況識(shí)別方法的不足,提出將人工智能領(lǐng)域的CFSFDP-HD技術(shù)與GMM模型結(jié)合用于對(duì)多模態(tài)過程的歷史工況進(jìn)行識(shí)別的方法,避免了K-均值法需要預(yù)先提供準(zhǔn)確聚類數(shù)量的缺點(diǎn),并利用案例對(duì)本文所提方法進(jìn)行了驗(yàn)證,結(jié)果表明:GMM(F-J)法不能保證準(zhǔn)確地識(shí)別工況,K-均值法只有在給定正確工況數(shù)量的前提下才能獲得較好的結(jié)果,而本文方法則可方便、有效地對(duì)歷史多工況進(jìn)行準(zhǔn)確識(shí)別,具有更強(qiáng)的實(shí)用性。

符 號(hào) 說 明

d過程變量的個(gè)數(shù)
g(x | θi )i個(gè)高斯模型所對(duì)應(yīng)的高斯密度函數(shù)
K聚類的數(shù)量,也是高斯模型的數(shù)量
kk個(gè)高斯模型,也表示第k個(gè)數(shù)據(jù)
P(s)(Ck|xj )j個(gè)樣本點(diǎn)第s次迭代屬于第k個(gè)高斯模型的概率
P(di,dj,t)樣本點(diǎn)ij的轉(zhuǎn)移概率
p(x|θ)概率密度函數(shù)
t高斯核密度估計(jì)函數(shù)的帶寬
Xn×dXn×d樣本數(shù)據(jù)矩陣,n為樣本數(shù),d為變量數(shù)
xi,j變量i的第j個(gè)樣本數(shù)據(jù)
xi,max變量i的最大樣本數(shù)據(jù)
xi,min變量i的最小樣本數(shù)據(jù)
δ樣本點(diǎn)到附近高密度點(diǎn)的距離
θii個(gè)高斯模型的參數(shù)
μii個(gè)高斯分量的變量平均值
ρi樣本點(diǎn)的密度
Σii個(gè)高斯分量的方差
τii個(gè)高斯分量的權(quán)重


關(guān)鍵字:優(yōu)秀論文

網(wǎng)絡(luò)客服QQ: 沈編輯

投訴建議:0373-5939925????投訴建議QQ:

招聘合作:2851259250@qq.com (如您是期刊主編、文章高手,可通過郵件合作)

地址:河南省新鄉(xiāng)市金穗大道東段266號(hào)中州期刊聯(lián)盟 ICP備案號(hào):豫ICP備2020036848

【免責(zé)聲明】:中州期刊聯(lián)盟所提供的信息資源如有侵權(quán)、違規(guī),請(qǐng)及時(shí)告知。

版權(quán)所有:中州期刊聯(lián)盟(新鄉(xiāng)市博翰文化傳媒有限公司)

關(guān)注”中州期刊聯(lián)盟”公眾號(hào)
了解論文寫作全系列課程

核心期刊為何難發(fā)?

論文發(fā)表總嫌貴?

職院?jiǎn)挝话l(fā)核心?

掃描關(guān)注公眾號(hào)

論文發(fā)表不再有疑惑

論文寫作全系列課程

掃碼了解更多

輕松寫核心期刊論文

在線留言