優(yōu)勝從選擇開始,我們是您最好的選擇!—— 中州期刊聯(lián)盟(新鄉(xiāng)市博翰文化傳媒有限公司)
0373-5939925
2851259250@qq.com
我要檢測(cè) 我要投稿 合法期刊查詢

迭代學(xué)習(xí)模型預(yù)測(cè)控制研究現(xiàn)狀與挑戰(zhàn)

作者:馬樂樂 劉向杰 高福榮來源:《自動(dòng)化學(xué)報(bào)》日期:2022-07-12人氣:4489

在現(xiàn)代智能制造業(yè)中, 批次生產(chǎn)方式占據(jù)越來越重要的地位, 多用于生產(chǎn)具有高附加值的精細(xì)化產(chǎn)品[1], 廣泛分布在化工、冶金等傳統(tǒng)重工業(yè)領(lǐng)域[2-4]和生物制藥、人工智能、半導(dǎo)體制造等高新工業(yè)領(lǐng)域[5-7]. 批次生產(chǎn)過程通常具有特定的加工順序, 并通過重復(fù)操作批量獲得同種產(chǎn)品, 其控制目標(biāo)通常為在有限時(shí)間區(qū)間內(nèi)重復(fù)跟蹤設(shè)定運(yùn)行軌跡.

批次過程的本質(zhì)特性明顯區(qū)別于連續(xù)過程, 可以歸納為“多樣產(chǎn)品”、“重復(fù)運(yùn)行”、“時(shí)段切換”和“變換指標(biāo)”四個(gè)方面[8]. 自20世紀(jì)90年代起, 由于產(chǎn)品種類增多、市場(chǎng)需求變化加快導(dǎo)致批次生產(chǎn)方式愈受青睞, 批次過程控制也逐漸成為一項(xiàng)獨(dú)立的研究課題. 總體來說, 批次過程控制研究歷經(jīng)了連續(xù)過程控制方法、迭代學(xué)習(xí)控制(Iterative learn-ing control, ILC)和迭代學(xué)習(xí)模型預(yù)測(cè)控制(Iterative learning model predictive control, ILMPC)三個(gè)階段, 圖1顯示了其發(fā)展歷程.

圖 1  批次過程控制發(fā)展歷程
Fig. 1  Development of batch process control

20世紀(jì)90年代, 依托于連續(xù)過程控制理論的飛速發(fā)展, 衍生了第一代批次過程控制技術(shù). 其核心思想是將批次過程視為有限時(shí)間內(nèi)的連續(xù)過程, 采用成熟的連續(xù)過程控制技術(shù)對(duì)批次過程進(jìn)行時(shí)域控制, 控制手段從傳統(tǒng)的比例?積分(Proportion integration, PI)控制策略[9]逐步發(fā)展至模型預(yù)測(cè)控制(Model predictive control, MPC)[10-12]、模糊控制[13]、神經(jīng)網(wǎng)絡(luò)控制[14]等先進(jìn)控制方法. 但是連續(xù)過程控制方法沒有考慮批次過程“多重時(shí)變”的特有性質(zhì), 難以解決實(shí)際批次過程的高精度軌跡跟蹤問題. 批次過程的動(dòng)態(tài)變化具有雙向性: 沿時(shí)間方向, 批次過程的設(shè)定值是時(shí)變的, 需要在每個(gè)采樣點(diǎn)跟蹤不同的目標(biāo)值; 沿批次方向, 各批次執(zhí)行重復(fù)的生產(chǎn)任務(wù), 需要利用積累的控制經(jīng)驗(yàn)不斷提高跟蹤性能. 這種特殊的控制目標(biāo)和控制結(jié)構(gòu)激發(fā)了眾多學(xué)者去探索基于迭代學(xué)習(xí)的批次過程控制方法.

迭代學(xué)習(xí)控制提出于20世紀(jì)80年代[15], 最早應(yīng)用于機(jī)器人控制. 它對(duì)同一軌跡進(jìn)行重復(fù)跟蹤, 以前一迭代次序中輸出信號(hào)與給定目標(biāo)的偏差修正下一迭代次序的控制信號(hào), 從而逐步提高系統(tǒng)的跟蹤性能, 最終實(shí)現(xiàn)有限區(qū)間上的完全跟蹤. ILC的迭代控制結(jié)構(gòu)與批次過程重復(fù)操作的特點(diǎn)高度契合, 能夠?qū)崿F(xiàn)批次過程高精度軌跡跟蹤的控制目標(biāo). 因此, 從20世紀(jì)90年代中期開始, ILC在批次過程控制中獲得了廣泛關(guān)注. 韓國學(xué)者Lee等最早將ILC應(yīng)用于聚合反應(yīng)器控制[16], 采用基于反饋的ILC沿批次更新學(xué)習(xí)律, 提高系統(tǒng)跟蹤精度; 隨后, Lee等結(jié)合最優(yōu)學(xué)習(xí)律, 提出基于二次型指標(biāo)的Q-ILC (Quadratic-criterion-based ILC, Q-ILC)策略, 顯著提高了ILC在批次過程中的學(xué)習(xí)性能. Lee等在發(fā)表于Control Engineering Practice的論文中系統(tǒng)綜述了ILC應(yīng)用于批次過程的幾種形式, 并集中討論了實(shí)際應(yīng)用中需要解決的問題[17]. 基于Lee等的研究工作, 后人針對(duì)批次過程的時(shí)滯、參數(shù)不確定性、隨機(jī)干擾等問題, 構(gòu)造了魯棒ILC策略[18-21]; 針對(duì)批次過程的初態(tài)偏移及變參考軌跡等問題, 提出了改進(jìn)的自適應(yīng)ILC策略[22-25]; 此外, ILC還與模糊規(guī)則、神經(jīng)網(wǎng)絡(luò)和數(shù)據(jù)驅(qū)動(dòng)等技術(shù)結(jié)合, 利用批次過程數(shù)據(jù)同時(shí)實(shí)施建模和控制[25-31]. 基于ILC的控制方法融合了批次過程有限時(shí)間重復(fù)操作的特點(diǎn), 沿迭代軸建立了批次間的控制關(guān)系, 其產(chǎn)生和發(fā)展標(biāo)志著批次過程控制正式獨(dú)立于連續(xù)過程控制, 形成了適應(yīng)批次過程特性的迭代控制結(jié)構(gòu).

ILC的應(yīng)用將批次過程控制從時(shí)域引入迭代域, 但是無論是傳統(tǒng)連續(xù)過程控制方法還是基于ILC的批次過程控制方法, 其控制信號(hào)只作用于一個(gè)維度. 在時(shí)域上, ILC是典型的開環(huán)控制, 不具備抗實(shí)時(shí)干擾能力, 無法保證系統(tǒng)的閉環(huán)穩(wěn)定性和魯棒性. 根據(jù)ILC的控制結(jié)構(gòu), 當(dāng)前批次出現(xiàn)的干擾和偏差直到下一批次才能被處理, 導(dǎo)致批次過程的時(shí)域跟蹤性能下降. 因此, 將ILC算法與成熟的時(shí)域控制技術(shù)結(jié)合成為了批次過程控制研究的新方向. 文獻(xiàn)[32-33]嘗試將ILC算法與傳統(tǒng)比例?積分?微分(Proportion integration differentiation, PID)控制策略結(jié)合, 利用ILC沿批次進(jìn)行設(shè)定點(diǎn)迭代學(xué)習(xí). 但是PID控制只適用于調(diào)節(jié)問題, 而批次過程的設(shè)定值是時(shí)變的, PID控制無法滿足批次過程高精度軌跡跟蹤的控制要求. MPC能夠根據(jù)系統(tǒng)模型預(yù)測(cè)未來的狀態(tài)及輸出, 在當(dāng)前時(shí)刻的滾動(dòng)時(shí)域優(yōu)化中直接采用時(shí)變的設(shè)定值軌跡作為目標(biāo)輸出, 因而在軌跡跟蹤控制方面具有突出優(yōu)勢(shì)[34-35]. 將ILC與MPC結(jié)合不僅能保留ILC的批次學(xué)習(xí)能力, 同時(shí)可以大大提高時(shí)域閉環(huán)跟蹤性能, 由此形成的迭代學(xué)習(xí)模型預(yù)測(cè)控制(ILMPC)標(biāo)志著批次過程控制進(jìn)入二維(Two-dimensional, 2D)控制時(shí)代, 其算法結(jié)構(gòu)如圖2所示. ILC根據(jù)歷史數(shù)據(jù)以批次為單位更新全區(qū)間控制律, MPC在各批次內(nèi)通過預(yù)測(cè)未來系統(tǒng)狀態(tài)和輸出進(jìn)行滾動(dòng)時(shí)域優(yōu)化獲得當(dāng)前時(shí)刻的控制信號(hào).

圖 2  迭代學(xué)習(xí)模型預(yù)測(cè)控制結(jié)構(gòu)
Fig. 2  Structure of ILMPC

加拿大學(xué)者Bone于1995年在Automatica期刊上首次提出將ILC與廣義預(yù)測(cè)控制(Generalized predictive control, GPC)結(jié)合[36], 利用ILC的學(xué)習(xí)能力改善GPC在重復(fù)性干擾下的控制效果, 形成了ILMPC算法的雛形; 韓國學(xué)者Lee等于1999年在AIChE Journal發(fā)表的論文中結(jié)合ILC和模型算法控制(Model algorithm control, MAC)建立了批次模型預(yù)測(cè)控制(Batch model predictive control, BMPC)策略, 并首次將ILMPC算法應(yīng)用于間歇反應(yīng)器控制[37]; 2000年, Lee等在IEEE Transactions on Automatic Control期刊上對(duì)BMPC的收斂性進(jìn)行了嚴(yán)格的理論證明[38], 將ILMPC的理論研究推向新的高度; 文獻(xiàn)[39-40]在BMPC的基礎(chǔ)上, 令I(lǐng)LC和MPC分別作用于批次方向和時(shí)間方向, 形成經(jīng)典的兩段式ILMPC (Two-stage ILMPC) 控制架構(gòu).

歷經(jīng)20多年的發(fā)展, ILMPC已經(jīng)成為批次過程控制領(lǐng)域的主流方法[41]. 本文將在分析現(xiàn)有成熟的迭代學(xué)習(xí)模型預(yù)測(cè)控制理論的基礎(chǔ)上, 指出其面臨的挑戰(zhàn), 綜述該領(lǐng)域的研究動(dòng)態(tài), 并展望迭代學(xué)習(xí)模型預(yù)測(cè)控制的未來研究方向. 本文的結(jié)構(gòu)框架及主要內(nèi)容如圖3所示.

圖 3  結(jié)構(gòu)及主要內(nèi)容
Fig. 3  The structure and main contents

在由ILC和MPC共同作用的2D控制框架下, ILMPC算法的模型搭建、控制律優(yōu)化及跟蹤性能分析都需要從時(shí)間軸和迭代軸兩個(gè)方向同時(shí)進(jìn)行. 綜合來看, ILMPC的理論體系包含三個(gè)基本問題: 二維預(yù)測(cè)模型建立、控制律迭代優(yōu)化以及二維穩(wěn)定性分析.

MPC的預(yù)測(cè)功能需要基于預(yù)測(cè)模型實(shí)現(xiàn), 預(yù)測(cè)模型的形式靈活多變. 在經(jīng)典的MPC理論中, MAC采用的脈沖響應(yīng)預(yù)測(cè)模型和動(dòng)態(tài)矩陣控制(Dynamic matrix control, DMC)采用的階躍響應(yīng)預(yù)測(cè)模型均是通過工業(yè)試驗(yàn)得到的非參數(shù)模型; GPC采用的受控自回歸積分滑動(dòng)平均(Controlled autoregressive integrated moving average, CARIMA)預(yù)測(cè)模型和非線性MPC經(jīng)常使用的狀態(tài)空間預(yù)測(cè)模型都可劃分為參數(shù)模型. 隨著現(xiàn)代工業(yè)系統(tǒng)逐步朝著高復(fù)雜度和高集成度方向發(fā)展, 利用機(jī)器學(xué)習(xí)技術(shù)建立數(shù)據(jù)驅(qū)動(dòng)非參數(shù)預(yù)測(cè)模型對(duì)提高模型精度和控制品質(zhì)具有重要意義.

ILMPC預(yù)測(cè)模型的作用與MPC相同, 可以適應(yīng)多種參數(shù)和非參數(shù)形式. 但是ILMPC在控制結(jié)構(gòu)上與MPC有本質(zhì)區(qū)別, 其二維控制結(jié)構(gòu)要求預(yù)測(cè)模型同時(shí)包含時(shí)間和批次兩個(gè)方向的信息. MPC算法只需考慮對(duì)象的時(shí)域動(dòng)態(tài)特性, 預(yù)測(cè)模型通常是基于當(dāng)前時(shí)刻狀態(tài), 構(gòu)造控制時(shí)域內(nèi)的輸入向量與預(yù)測(cè)時(shí)域內(nèi)的輸出向量間的關(guān)系. 而ILMPC需要同時(shí)考慮對(duì)象在時(shí)域和迭代域上的動(dòng)態(tài)特性, 在時(shí)域預(yù)測(cè)模型的基礎(chǔ)上進(jìn)一步搭建相鄰批次間的迭代關(guān)系, 形成2D預(yù)測(cè)模型. 在現(xiàn)有ILMPC研究中, 2D預(yù)測(cè)模型形式基本沿襲了MPC預(yù)測(cè)模型, 大致可以分為三類: 2D輸入輸出預(yù)測(cè)模型、2D狀態(tài)空間預(yù)測(cè)模型和2D非線性隱式預(yù)測(cè)模型.

1.1.1   2D輸入輸出預(yù)測(cè)模型

輸入輸出模型主要通過實(shí)際工業(yè)系統(tǒng)歷史數(shù)據(jù)辨識(shí)得到, 結(jié)構(gòu)相對(duì)簡(jiǎn)單, 便于直接推導(dǎo)輸入迭代變化量和輸出跟蹤誤差之間的關(guān)系. 因此, 早期的ILMPC算法大都采用2D輸入輸出預(yù)測(cè)模型. 文獻(xiàn)[36]利用平均算子建立系統(tǒng)干擾沿批次的迭代關(guān)系, 得到了二維CARIMA預(yù)測(cè)模型, 其中控制變量僅體現(xiàn)沿時(shí)間方向的動(dòng)態(tài)變化; 文獻(xiàn)[37]將相鄰批次的系統(tǒng)模型作差并沿時(shí)間軸展開, 形成了基于脈沖響應(yīng)矩陣的2D輸入輸出模型, 其控制變量形式進(jìn)一步體現(xiàn)了迭代變化規(guī)律; 文獻(xiàn)[42]通過將階躍響應(yīng)模型沿批次作差構(gòu)造2D輸入輸出模型, 建立了控制輸入增量的迭代變化關(guān)系; 文獻(xiàn)[43-45]利用CARIMA模型沿批次的增量模型, 推導(dǎo)了系統(tǒng)控制變量為輸入增量迭代變化量的2D預(yù)測(cè)模型, 其中還同時(shí)包含干擾的迭代變化量; 文獻(xiàn)[46]結(jié)合了2D脈沖響應(yīng)預(yù)測(cè)模型和模糊神經(jīng)網(wǎng)絡(luò)技術(shù), 構(gòu)造了非線性系統(tǒng)的2D模糊神經(jīng)網(wǎng)絡(luò)輸入輸出預(yù)測(cè)模型. 盡管采用2D輸入輸出預(yù)測(cè)模型有利于降低ILMPC控制器設(shè)計(jì)難度, 但是輸入輸出結(jié)構(gòu)無法表征復(fù)雜系統(tǒng)的重要狀態(tài)變量信息, 難以與現(xiàn)代控制理論和系統(tǒng)優(yōu)化理論接軌, 在算法應(yīng)用和發(fā)展上都存在一定局限性.

1.1.2   2D狀態(tài)空間預(yù)測(cè)模型

狀態(tài)空間方法是現(xiàn)代控制理論和系統(tǒng)優(yōu)化理論的重要基礎(chǔ). MPC理論體系立足于最優(yōu)控制, 其可行性及穩(wěn)定性結(jié)論都以狀態(tài)空間方法為工具. 因此, 在ILMPC中采用2D狀態(tài)空間預(yù)測(cè)模型進(jìn)行控制器設(shè)計(jì), 不僅對(duì)復(fù)雜批次過程控制具有指導(dǎo)意義, 還便于利用MPC成熟的理論體系對(duì)ILMPC的穩(wěn)定性、收斂性等系統(tǒng)性能進(jìn)行定性分析. 狀態(tài)空間模型通過狀態(tài)變量聯(lián)立系統(tǒng)輸入和輸出, 為建立跟蹤誤差與系統(tǒng)輸入間的迭代關(guān)系, 通常需要進(jìn)行狀態(tài)增廣. 文獻(xiàn)[47]將分段仿射(Piecewise affine, PWA)狀態(tài)模型沿批次進(jìn)行增廣, 構(gòu)建了2D Fornasini–Marchesini (FM)模型, 增廣后的狀態(tài)變量為狀態(tài)迭代變化量和輸出跟蹤誤差, 再沿時(shí)間軸基于2D FM模型預(yù)測(cè)未來的增廣狀態(tài), 形成2D FM狀態(tài)空間預(yù)測(cè)模型; 文獻(xiàn)[48-51]基于線性定常(Linear time invariant, LTI)系統(tǒng)推導(dǎo)以系統(tǒng)狀態(tài)和輸入變量為增廣狀態(tài)的狀態(tài)空間模型, 再通過作差的方式得到相鄰批次間的迭代關(guān)系, 構(gòu)造了控制變量為輸入信號(hào)增量迭代變化量的2D預(yù)測(cè)模型. 文獻(xiàn)[52]針對(duì)一類具有未知輸入非線性的系統(tǒng), 借助全局Lipschitz連續(xù)性條件構(gòu)建了顯式的線性2D狀態(tài)空間預(yù)測(cè)模型, 使非線性ILMPC轉(zhuǎn)化為簡(jiǎn)單的二次規(guī)劃(Quadratic programming, QP)問題; 文獻(xiàn)[53]考慮一類具有未知干擾非線性的系統(tǒng), 建立了具有干擾不確定性的顯式2D狀態(tài)空間預(yù)測(cè)模型, 通過迭代計(jì)算逼近干擾量進(jìn)而獲得ILMPC的近似最優(yōu)解. 文獻(xiàn)[54]針對(duì)一般非線性系統(tǒng), 通過工作點(diǎn)線性化得到了顯式2D狀態(tài)空間預(yù)測(cè)模型, 并利用Lipschitz條件在ILMPC優(yōu)化中實(shí)現(xiàn)了對(duì)線性化誤差的補(bǔ)償.

1.1.3   2D非線性隱式預(yù)測(cè)模型

上述的2D輸入輸出預(yù)測(cè)模型和2D狀態(tài)空間預(yù)測(cè)模型都可以歸結(jié)為顯式預(yù)測(cè)模型, 它們采用2D線性模型或者近似線性模型進(jìn)行預(yù)測(cè), 能夠直接推出未來一段時(shí)間內(nèi)系統(tǒng)輸入到系統(tǒng)輸出的顯式關(guān)系, 形成的優(yōu)化問題大都能夠通過QP高效求解. 隨著現(xiàn)代工業(yè)的發(fā)展, 批次過程的生產(chǎn)規(guī)模、設(shè)備種類以及結(jié)構(gòu)復(fù)雜性日益增長, 簡(jiǎn)單的顯式預(yù)測(cè)模型已經(jīng)不足以描述批次過程的復(fù)雜動(dòng)態(tài)特性. 為了保證跟蹤精度, 直接采用較為精確的非線性模型進(jìn)行隱式預(yù)測(cè)成為ILMPC的另一重要研究方向. 文獻(xiàn)[55-56]利用神經(jīng)網(wǎng)絡(luò)模型進(jìn)行隱式預(yù)測(cè), 得到的非線性優(yōu)化問題通過序列二次規(guī)劃(Sequential quadratic programming, SQP)、粒子群算法(Particle swarm optimization, PSO)或遺傳算法(Genetic algorithm, GA)等方法進(jìn)行求解; 文獻(xiàn)[57]建立了插電式混合動(dòng)力汽車的2D Roesser非線性機(jī)理模型, 通過隱式預(yù)測(cè)形成非線性ILMPC優(yōu)化問題, 并通過改進(jìn)動(dòng)態(tài)規(guī)劃(Improved dynamic programming, IDP)方法進(jìn)行求解. 雖然2D非線性隱式預(yù)測(cè)模型能夠最大程度地保證控制精確性, 但同時(shí)導(dǎo)致ILMPC優(yōu)化的計(jì)算復(fù)雜度大大增加. 如何設(shè)計(jì)更為有效的2D預(yù)測(cè)模型結(jié)構(gòu)以實(shí)現(xiàn)跟蹤精度和計(jì)算效率的平衡, 是ILMPC理論研究的難點(diǎn)之一.

ILMPC需要根據(jù)過去批次的過程數(shù)據(jù)沿迭代軸進(jìn)行控制律更新, 這通常是通過沿批次的迭代優(yōu)化實(shí)現(xiàn)的. 現(xiàn)有ILMPC研究工作主要圍繞著兩種優(yōu)化結(jié)構(gòu)展開: 1)將ILC和MPC集成為一個(gè)二維優(yōu)化問題, 在每個(gè)采樣時(shí)刻對(duì)當(dāng)前控制律進(jìn)行更新; 2)按順序分別進(jìn)行ILC優(yōu)化和MPC優(yōu)化, 在每個(gè)批次開始前基于2D模型求解整個(gè)批次內(nèi)的ILC控制律, 再采用MPC基于2D預(yù)測(cè)模型進(jìn)行滾動(dòng)時(shí)域優(yōu)化, 在ILC控制律的基礎(chǔ)上進(jìn)一步修正. 通常, 具有第1種優(yōu)化結(jié)構(gòu)的ILMPC算法稱為整體式(Intergrated) ILMPC, 具有第2種結(jié)構(gòu)的ILMPC算法稱為兩段式(Two-stage) ILMPC.

1.2.1   整體式ILMPC

整體式ILMPC控制器本質(zhì)是基于2D預(yù)測(cè)模型的MPC控制器, 它借助存儲(chǔ)的前一批次控制信息, 通過最小化未來一段時(shí)間的跟蹤誤差獲得當(dāng)前批次當(dāng)前時(shí)刻的控制輸入迭代變化量, 從而實(shí)現(xiàn)學(xué)習(xí)功能[3742-44], 其結(jié)構(gòu)如圖4所示. 整體式ILMPC的最優(yōu)性、可行性及穩(wěn)定性等性質(zhì)可以通過MPC理論進(jìn)行定性分析, 優(yōu)化算法的可實(shí)施性較強(qiáng), 同時(shí)計(jì)算負(fù)擔(dān)較小. 整體式ILMPC的控制信號(hào)直接產(chǎn)生于MPC控制器, 一方面降低了約束處理的難度, 另一方面利于與魯棒、隨機(jī)等先進(jìn)控制技術(shù)結(jié)合. 文獻(xiàn)[58-59]分別針對(duì)批次系統(tǒng)的模型參數(shù)不確定性和干擾不確定性問題, 基于2D LTI狀態(tài)空間預(yù)測(cè)模型設(shè)計(jì)了魯棒整體式ILMPC方法; 文獻(xiàn)[60-61]分別考慮批次過程的隨機(jī)擾動(dòng)和隨機(jī)狀態(tài)約束問題, 構(gòu)造了隨機(jī)整體式ILMPC策略.

圖 4  整體式ILMPC結(jié)構(gòu)
Fig. 4  Scheme of integrated ILMPC

1.2.2   兩段式ILMPC

兩段式ILMPC多基于前饋-反饋機(jī)制, 通常形式為先基于存儲(chǔ)的前一批次數(shù)據(jù)進(jìn)行離線ILC優(yōu)化得到整個(gè)批次的前饋控制律, 再在每個(gè)采樣間隔進(jìn)行滾動(dòng)時(shí)域MPC優(yōu)化得到反饋控制律, 其控制結(jié)構(gòu)如圖5所示. 這種Two-stage優(yōu)化方案將ILC功能和MPC功能進(jìn)行了分離, 沿批次進(jìn)行的ILC控制只處理重復(fù)性干擾, 沿時(shí)域進(jìn)行的MPC控制負(fù)責(zé)抑制隨機(jī)干擾. 因而Two-stage ILMPC的迭代學(xué)習(xí)進(jìn)程不受隨機(jī)過程信息的影響, 其學(xué)習(xí)效率和收斂速度通常高于整體式ILMPC. 文獻(xiàn)[39-40]基于2D脈沖響應(yīng)預(yù)測(cè)模型, 采用前饋?反饋機(jī)制構(gòu)建Two-stage ILMPC算法, 通過ILC優(yōu)化和MPC優(yōu)化分別產(chǎn)生ILC控制量和MPC控制量, 施加于被控系統(tǒng)的控制作用為兩者之和; 文獻(xiàn)[55]基于2D非線性模糊神經(jīng)網(wǎng)絡(luò)模型, 先獨(dú)立優(yōu)化ILC控制律, 再利用已知的ILC控制量和待優(yōu)化的MPC控制量推導(dǎo)時(shí)域隱式預(yù)測(cè)模型, 通過滾動(dòng)時(shí)域優(yōu)化求解得到MPC控制量. 另一種典型Two-stage ILMPC保持了ILC和MPC功能的整體性, 只根據(jù)控制目標(biāo)將ILMPC優(yōu)化過程分割為兩個(gè)階段, 第1階段抑制非重復(fù)性干擾, 第2階段在重復(fù)性干擾下最小化跟蹤誤差, 提高系統(tǒng)跟蹤精度和收斂速度[62].

圖 5  Two-stage ILMPC結(jié)構(gòu)
Fig. 5  Scheme of two-stage ILMPC

綜合前述的模型形式和優(yōu)化結(jié)構(gòu)差異, ILMPC的分類情況及各自優(yōu)勢(shì)、局限性如表1所示.

表 1  迭代學(xué)習(xí)模型預(yù)測(cè)控制分類
Table 1  Categories of ILMPC
分類依據(jù)類別優(yōu)勢(shì)局限性
模型形式2D輸入輸出預(yù)測(cè)模型[36?3742?46]便于直接推導(dǎo)迭代關(guān)系無法表征系統(tǒng)內(nèi)部動(dòng)態(tài)
2D狀態(tài)空間預(yù)測(cè)模型[47?54]便于系統(tǒng)性能定性分析需完全掌握系統(tǒng)狀態(tài)信息
2D非線性隱式預(yù)測(cè)模型[55?57]精確描述非線性動(dòng)態(tài)特性優(yōu)化計(jì)算復(fù)雜度增加
優(yōu)化結(jié)構(gòu)整體式結(jié)構(gòu)[3742?44]便于性能分析, 計(jì)算負(fù)擔(dān)小學(xué)習(xí)作用難以充分發(fā)揮
兩段式結(jié)構(gòu)[39?405562]避免隨機(jī)過程信息影響性能分析較難, 計(jì)算負(fù)擔(dān)大

ILMPC是典型的二維控制系統(tǒng), 其穩(wěn)定性應(yīng)從迭代和時(shí)間兩個(gè)維度進(jìn)行分析, 稱為二維穩(wěn)定性分析. 在迭代軸方向上, ILMPC系統(tǒng)的穩(wěn)定性主要體現(xiàn)為沿批次的收斂性問題. 在時(shí)間軸方向上, ILMPC的穩(wěn)定性主要體現(xiàn)為沿時(shí)間的Lyapunov穩(wěn)定性. 針對(duì)ILC的收斂性問題, 現(xiàn)有研究主要是通過代入控制變量顯式地推導(dǎo)跟蹤誤差的迭代關(guān)系, 得出系統(tǒng)收斂的不等式條件[63-64]. 這種分析方法較為簡(jiǎn)便, 且能得到系統(tǒng)嚴(yán)格收斂的結(jié)論, 但是不適用于無法得到顯式解的帶約束問題; 針對(duì)MPC的穩(wěn)定性問題, 基于終端約束集的控制器設(shè)計(jì)方法是保證系統(tǒng)Lyapunov穩(wěn)定性的最有效途徑[65], 通過在滾動(dòng)時(shí)域優(yōu)化問題中引入終端代價(jià)函數(shù)和終端約束, 使得由系統(tǒng)優(yōu)化目標(biāo)函數(shù)充當(dāng)?shù)腖yapunov函數(shù)沿時(shí)間軸遞減. 然而, 對(duì)于具有強(qiáng)非線性或不確定性的系統(tǒng)而言, 設(shè)計(jì)終端約束集仍面臨很大困難. ILMPC的二維結(jié)構(gòu)決定了系統(tǒng)的時(shí)域特性和迭代域特性互相影響, 互相牽制, 因此無法單獨(dú)采用ILC或MPC領(lǐng)域的已有方法進(jìn)行收斂性或穩(wěn)定性分析. 此外, 批次過程的強(qiáng)非線性、不確定性及多約束等問題導(dǎo)致ILMPC的二維穩(wěn)定性分析愈加困難.

1.3.1   時(shí)域Lyapunov穩(wěn)定性

2D系統(tǒng)的時(shí)域性能和迭代域性能密不可分, 時(shí)域穩(wěn)定性是實(shí)現(xiàn)迭代收斂性的重要前提, 在2D框架下構(gòu)造具有時(shí)域穩(wěn)定性的ILMPC控制器能夠?yàn)橄到y(tǒng)的實(shí)時(shí)跟蹤性能提供有力保障. 從MPC穩(wěn)定性理論出發(fā), ILMPC系統(tǒng)的時(shí)域Lyapunov穩(wěn)定性即指基于二維預(yù)測(cè)模型的時(shí)域優(yōu)化目標(biāo)函數(shù)沿時(shí)間軸的收斂問題. 對(duì)于約束系統(tǒng), 通常要基于系統(tǒng)遞歸可行性的前提保證穩(wěn)定性. 利用最優(yōu)解必定優(yōu)于可行解的一般性結(jié)論, 得到ILMPC閉環(huán)系統(tǒng)的時(shí)域Lyapunov穩(wěn)定性結(jié)論. 文獻(xiàn)[3746]通過假設(shè)在+1時(shí)刻控制時(shí)域內(nèi)最后一個(gè)輸入的迭代變化量為零, 利用t時(shí)刻的最優(yōu)解構(gòu)造了t+1時(shí)刻的最優(yōu)解, 進(jìn)而根據(jù)最優(yōu)解與可行解的關(guān)系, 證明了目標(biāo)函數(shù)在無窮時(shí)域內(nèi)的有界性. 文獻(xiàn)[55-56]采用變預(yù)測(cè)時(shí)域的ILMPC優(yōu)化機(jī)制, 保證每個(gè)時(shí)刻的最優(yōu)解必定是下一時(shí)刻的可行解, 進(jìn)而實(shí)現(xiàn)了目標(biāo)函數(shù)沿時(shí)間軸非增. 文獻(xiàn)[58-59]在時(shí)域上采用了魯棒預(yù)測(cè)控制結(jié)構(gòu), 將系統(tǒng)物理約束和Lyapunov穩(wěn)定性條件均轉(zhuǎn)化為線性不等式約束, 構(gòu)造反饋控制律令系統(tǒng)若初始可行必遞歸可行.

1.3.2   迭代收斂性

ILMPC的迭代收斂性是指: 當(dāng)?shù)涡蜈吔鼰o窮時(shí), 系統(tǒng)跟蹤誤差收斂到零或者某一常數(shù). ILMPC的收斂性分析主要遵循兩種方式:

針對(duì)無約束系統(tǒng), 直接求出ILMPC優(yōu)化問題的顯式解, 將顯式解代入系統(tǒng)模型, 推導(dǎo)相鄰批次間跟蹤誤差的迭代關(guān)系, 從而得到跟蹤誤差沿迭代軸單調(diào)收斂的不等式條件. 文獻(xiàn)[42]將ILMPC優(yōu)化問題的顯式解代入階躍響應(yīng)模型, 得到了相鄰批次間跟蹤誤差向量的等式關(guān)系, 再令轉(zhuǎn)移矩陣的譜半徑或范數(shù)小于1得到ILMPC系統(tǒng)的單調(diào)收斂條件; 文獻(xiàn)[48]基于所有批次初始狀態(tài)保持不變的假設(shè), 將顯式解代入Kalman濾波器作用下的LTI狀態(tài)模型, 得到ILMPC的單調(diào)收斂條件.

針對(duì)約束系統(tǒng), 首先通過設(shè)計(jì)穩(wěn)定預(yù)測(cè)控制器保證跟蹤誤差在每個(gè)批次內(nèi)的收斂性或有界性, 再利用批次過程的重復(fù)特性, 證明跟蹤誤差沿批次的收斂性. 文獻(xiàn)[38]基于預(yù)測(cè)控制的穩(wěn)定性分析方法推得優(yōu)化目標(biāo)函數(shù)值的時(shí)域有界性, 進(jìn)而通過前一批次末端狀態(tài)和后一批次初態(tài)間的關(guān)系, 證明了跟蹤誤差沿迭代軸收斂到零; 文獻(xiàn)[55]基于變時(shí)域預(yù)測(cè)控制目標(biāo)函數(shù)的非增性質(zhì), 在系統(tǒng)初態(tài)保持不變的前提下利用夾逼定理證明了跟蹤誤差沿迭代軸收斂到某一常數(shù); 文獻(xiàn)[59]在時(shí)域上采用基于終端不變集的MPC優(yōu)化方法保證了系統(tǒng)跟蹤誤差的有界性, 繼而借助最優(yōu)解的性質(zhì)遞推證明了批次內(nèi)任意采樣時(shí)刻跟蹤誤差沿迭代軸的收斂性.

迭代學(xué)習(xí)模型預(yù)測(cè)控制衍生于發(fā)展成熟的ILC和MPC技術(shù), 具有較為完備的理論基礎(chǔ). 但是, ILC和MPC從控制目標(biāo)、優(yōu)化結(jié)構(gòu)等方面存在本質(zhì)區(qū)別, 將兩者融入到一個(gè)2D框架下對(duì)系統(tǒng)的建模、優(yōu)化、穩(wěn)定性分析等帶來了挑戰(zhàn). 建立從建模、優(yōu)化到性能分析的完整理論體系仍是批次過程ILMPC的研究難點(diǎn). 同時(shí), 批次過程“多重時(shí)變”的特點(diǎn)要求ILMPC控制器對(duì)變參考軌跡、變批次長度、變模型參數(shù)等情況具有良好的適應(yīng)性. 如何在不影響系統(tǒng)2D穩(wěn)定性的前提下提高對(duì)批次過程變工況的適應(yīng)性是ILMPC控制器設(shè)計(jì)面臨的又一挑戰(zhàn).

建模問題一直是批次過程控制領(lǐng)域的研究熱點(diǎn)[66-68]. ILMPC的時(shí)域跟蹤性能和迭代域收斂特性都很大程度上依賴于模型的準(zhǔn)確性. 盡管ILC在發(fā)展初期被定位為無模型控制系統(tǒng)綜合方法, 但在系統(tǒng)模型可獲得的情況下利用模型構(gòu)造學(xué)習(xí)律能大大提高學(xué)習(xí)效率, 縮短學(xué)習(xí)過程[69-70]. MPC是一種基于模型的先進(jìn)控制技術(shù), 其算法魯棒性和穩(wěn)定性都與預(yù)測(cè)模型的準(zhǔn)確度息息相關(guān)[71-72]. 因此, 建立精確的2D模型對(duì)ILMPC算法功能的實(shí)現(xiàn)尤為重要. 實(shí)際批次過程通常具有明顯的非線性特征, 按模型可獲取程度大致可以分為兩類: 第1類是可以獲取具有足夠精度的機(jī)理模型的簡(jiǎn)單過程; 第2類是機(jī)理模型及辨識(shí)模型無法獲取或難以用于控制的復(fù)雜過程.

2.1.1   機(jī)理建模

針對(duì)簡(jiǎn)單非線性過程, 最可靠的建模方法就是根據(jù)被控系統(tǒng)內(nèi)部機(jī)制或者物質(zhì)流的傳遞機(jī)理建立精確的機(jī)理模型. 機(jī)理模型又稱白箱模型, 它是基于質(zhì)量平衡方程、能量平衡方程、動(dòng)量平衡方程、相平衡方程以及某些物性方程、化學(xué)反應(yīng)定律、電路基本定律等而獲得對(duì)象或過程的數(shù)學(xué)模型. 機(jī)理模型的優(yōu)點(diǎn)是參數(shù)具有非常明確的物理意義, 模型參數(shù)易于調(diào)整, 具有很強(qiáng)的適應(yīng)性. 但是實(shí)際工業(yè)對(duì)象的過程特性通常無法精確表達(dá)為數(shù)學(xué)形式, 并且表達(dá)式中存在大量難以確定的參數(shù), 進(jìn)而影響到模型的精確性. 在現(xiàn)今發(fā)展階段, ILMPC的研究工作主要面向?qū)A(chǔ)控制理論的改進(jìn)和完善, 因此大都直接基于對(duì)象非線性機(jī)理模型建立相應(yīng)的ILMPC算法[47-54]. 為了在控制器設(shè)計(jì)和性能分析中運(yùn)用成熟的線性系統(tǒng)控制理論, 通常需要將非線性機(jī)理模型進(jìn)行線性化, 基于所得線性模型推導(dǎo)2D預(yù)測(cè)模型, 其中線性化誤差項(xiàng)一般考慮為系統(tǒng)的不確定擾動(dòng). 文獻(xiàn)[47]將非線性機(jī)理模型進(jìn)行分段線性化, 并在各階段設(shè)計(jì)不同的優(yōu)化目標(biāo)函數(shù)求解ILMPC控制量; 文獻(xiàn)[54]通過泰勒展開的方法對(duì)非線性機(jī)理模型進(jìn)行工作點(diǎn)處線性化, 利用Lipschitz連續(xù)性條件在2D預(yù)測(cè)模型中補(bǔ)償線性化高階項(xiàng)產(chǎn)生的不確定性; 文獻(xiàn)[58]將非線性注塑系統(tǒng)描述為具有參數(shù)不確定性的線性化系統(tǒng), 設(shè)計(jì)了對(duì)應(yīng)的魯棒ILMPC策略.

2.1.2   數(shù)據(jù)驅(qū)動(dòng)建模

針對(duì)復(fù)雜非線性過程, 可以采用數(shù)據(jù)驅(qū)動(dòng)建模的手段為ILMPC設(shè)計(jì)提供模型支撐. 批次生產(chǎn)過程中每時(shí)每刻都產(chǎn)生并儲(chǔ)存了大量的關(guān)于過程運(yùn)行和設(shè)備狀態(tài)的數(shù)據(jù), 且數(shù)據(jù)量隨著重復(fù)操作的進(jìn)行不斷累積增大. 利用這些離線或在線的數(shù)據(jù)獲取被控系統(tǒng)的動(dòng)態(tài)特性是解決難建模批次過程控制問題的有效途徑. 以迭代軸作為參考方向, 批次過程數(shù)據(jù)進(jìn)行在線積累和更新; 以時(shí)間軸作為參考方向, 批次過程數(shù)據(jù)進(jìn)行離線存儲(chǔ)和調(diào)用. 批次過程控制特有的2D結(jié)構(gòu)要求數(shù)據(jù)采集和利用也必須迭代進(jìn)行. 神經(jīng)網(wǎng)絡(luò)模型具有超強(qiáng)的非線性映射能力、泛化能力、自學(xué)習(xí)和自適應(yīng)能力, 在批次過程數(shù)據(jù)驅(qū)動(dòng)建模方面得到了廣泛關(guān)注. 文獻(xiàn)[29]基于遞歸神經(jīng)網(wǎng)絡(luò)對(duì)系統(tǒng)非線性進(jìn)行重復(fù)辨識(shí), 并利用過去批次的平均建模誤差對(duì)當(dāng)前批次的神經(jīng)網(wǎng)絡(luò)模型進(jìn)行校正; 文獻(xiàn)[55]基于批次過程數(shù)據(jù)進(jìn)行模糊神經(jīng)網(wǎng)絡(luò)建模, 在當(dāng)前批次開始前利用前幾批次存儲(chǔ)的過程數(shù)據(jù)更新模型參數(shù); 文獻(xiàn)[73]利用徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)對(duì)非線性批次過程進(jìn)行迭代建模, 并采用最速下降法獲得網(wǎng)絡(luò)連接權(quán)值沿迭代軸的更新方程.

隨著工程數(shù)學(xué)與應(yīng)用物理的深度融合以及人工智能的迅猛發(fā)展, 機(jī)理建模和數(shù)據(jù)驅(qū)動(dòng)建模技術(shù)都日益成熟. 然而, 批次過程的“多重時(shí)變”特性對(duì)其建模過程提出了許多新要求. 首先, 批次過程通常用于生產(chǎn)高精細(xì)化產(chǎn)品, 控制系統(tǒng)需時(shí)刻保持高跟蹤精度, 這對(duì)模型精確性提出了更高的要求. 無論是機(jī)理建模方法還是數(shù)據(jù)驅(qū)動(dòng)建模方法都不可避免地存在建模誤差, 利用迭代軸上累積的過程數(shù)據(jù)反復(fù)進(jìn)行誤差估計(jì)和補(bǔ)償是提高系統(tǒng)跟蹤精度的關(guān)鍵, 也是批次過程迭代建模中的重點(diǎn)和難點(diǎn). 其次, 一個(gè)完整的批次過程通常包含多個(gè)操作階段, 每個(gè)階段的動(dòng)態(tài)特性存在明顯差異, 如何實(shí)現(xiàn)多階段精確建模和平滑切換是未來批次過程建模的重要研究方向.

ILMPC控制系統(tǒng)在每個(gè)采樣間隔需要求解基于2D預(yù)測(cè)模型的約束優(yōu)化問題. 當(dāng)采用簡(jiǎn)單的線性模型為預(yù)測(cè)模型時(shí), 優(yōu)化問題的求解效率較快, 但是線性模型與實(shí)際非線性過程的失配問題會(huì)導(dǎo)致控制器的最優(yōu)性下降. 當(dāng)直接采用較為準(zhǔn)確的非線性模型作為預(yù)測(cè)模型時(shí), 盡管控制最優(yōu)性會(huì)得到一定程度的提升, 但是運(yùn)用非線性規(guī)劃求解方法會(huì)導(dǎo)致每個(gè)采樣周期內(nèi)的計(jì)算負(fù)擔(dān)加重, 從而造成控制效率的下降. ILMPC優(yōu)化的研究難點(diǎn)主要在于如何實(shí)現(xiàn)最優(yōu)性和優(yōu)化計(jì)算效率間的平衡.

2.2.1   最優(yōu)性

對(duì)于基于預(yù)測(cè)模型的ILMPC算法, 提高控制最優(yōu)性的首要問題是實(shí)現(xiàn)對(duì)模型誤差的有效補(bǔ)償. 模型失配的程度越小, 控制信號(hào)對(duì)于實(shí)際非線性批次過程的適用性就越高. 文獻(xiàn)[37]將非線性批次過程辨識(shí)為線性脈沖響應(yīng)模型, 在每個(gè)采樣間隔利用Kalman濾波器對(duì)預(yù)測(cè)狀態(tài)進(jìn)行反饋校正, 使控制信號(hào)的最優(yōu)性提高; 文獻(xiàn)[54]在ILMPC算法內(nèi)考慮了線性化導(dǎo)致的模型失配問題, 利用Lipschitz連續(xù)性條件將優(yōu)化目標(biāo)函數(shù)表示為真實(shí)跟蹤誤差的上界, 從而提高控制輸入的最優(yōu)性.

對(duì)于帶不確定性的ILMPC系統(tǒng)而言, 魯棒性的提高通常會(huì)導(dǎo)致最優(yōu)性的下降. 為降低系統(tǒng)不確定性對(duì)跟蹤性能的影響, 魯棒ILMPC的設(shè)計(jì)目標(biāo)通常是保證已知范圍內(nèi)的所有可能干擾對(duì)系統(tǒng)性能指標(biāo)的影響小于某一界限, 或在參數(shù)不確定性包含的所有可能情況下滿足魯棒穩(wěn)定性條件. 文獻(xiàn)[58]設(shè)定系統(tǒng)在所有可能參數(shù)下的目標(biāo)函數(shù)小于某一定值, 不可避免地造成了控制器的保守性, 在一定程度上犧牲了最優(yōu)性; 文獻(xiàn)[59]針對(duì)約束批次過程設(shè)計(jì)基于終端橢圓不變集的魯棒ILMPC策略, 由于橢圓不變集無法實(shí)現(xiàn)終端域的最大化, 這種保證2D穩(wěn)定性的方法必然以犧牲最優(yōu)性為代價(jià). 因此, 在解決系統(tǒng)不確定性問題時(shí), 如何定性分析系統(tǒng)保守性并最大限度提高最優(yōu)性是一項(xiàng)重要研究內(nèi)容.

僅從優(yōu)化層面上看, ILMPC解的最優(yōu)性取決于采用的尋優(yōu)方法. 在線性模型下, ILMPC優(yōu)化問題通常是簡(jiǎn)單的凸優(yōu)化問題, 其局部最優(yōu)解即是全局最優(yōu)解, 因此尋優(yōu)方法通常不會(huì)影響解的最優(yōu)性; 在非線性模型下, ILMPC優(yōu)化問題通常為非凸優(yōu)化問題, 可能存在多個(gè)局部最優(yōu)解, 采用有下降參考的傳統(tǒng)尋優(yōu)方法計(jì)算量大, 并容易陷入局部最優(yōu), 導(dǎo)致解的最優(yōu)性下降. 針對(duì)非凸優(yōu)化問題, 采用PSO、GA等啟發(fā)式尋優(yōu)方法能大幅提高尋至全局最優(yōu)解的幾率, 但是這類尋優(yōu)方法需要的搜索時(shí)間相對(duì)較長, 只適合于采樣間隔較大的慢變過程. 在快變非線性批次過程中, 如何達(dá)到最優(yōu)性和計(jì)算效率的最佳平衡是現(xiàn)今ILMPC領(lǐng)域的難點(diǎn)問題.

2.2.2   優(yōu)化計(jì)算效率

在實(shí)際非線性批次過程控制中, ILMPC的優(yōu)化計(jì)算效率主要取決于兩個(gè)因素: 預(yù)測(cè)模型和尋優(yōu)算法. 降低模型復(fù)雜度和減小尋優(yōu)計(jì)算負(fù)擔(dān)是提高ILMPC優(yōu)化效率的兩個(gè)重要途徑. 通過對(duì)非線性系統(tǒng)進(jìn)行線性化獲得線性預(yù)測(cè)模型, 可以有效降低模型復(fù)雜度, 將復(fù)雜的ILMPC非線性規(guī)劃問題轉(zhuǎn)化為易于求解的線性規(guī)劃問題[48]. 但任何降低模型復(fù)雜度的方法勢(shì)必會(huì)導(dǎo)致模型精確度下降, 因此需要同時(shí)解決模型失配問題.

在ILMPC尋優(yōu)過程中, 需要從初始點(diǎn)開始進(jìn)行多步迭代才能到達(dá)局部最優(yōu)解, 因此減小尋優(yōu)計(jì)算量應(yīng)從減少迭代步數(shù)或減小每步迭代的計(jì)算量這兩個(gè)角度出發(fā). 減少迭代步數(shù)意味著加快尋優(yōu)算法的收斂速度. 傳統(tǒng)尋優(yōu)算法如梯度下降法、牛頓下降法和拉格朗日乘子法等都在每一步迭代中提供了下降的方向和大小參考, 因此收斂速度較快; 基于窮舉搜索的網(wǎng)格法、基于隨機(jī)搜索的模擬退火算法以及基于啟發(fā)式搜索的PSO、GA和蟻群算法(Ant colony optimization, ACO)的尋優(yōu)過程不依賴于下降參考, 參數(shù)選擇和更新具有一定隨機(jī)性, 搜索速度較慢, 需要較長的時(shí)間才能收斂到局部最優(yōu)解. 為提高啟發(fā)式尋優(yōu)算法的收斂速度, 交叉算法[74]、非線性慣性權(quán)重[75]、局部聚類[76]等方案在GA、PSO及ACO中得到了應(yīng)用, 同時(shí)還出現(xiàn)了大量將啟發(fā)式尋優(yōu)算法與傳統(tǒng)下降式尋優(yōu)算法結(jié)合的研究工作, 比如PSO梯度法[77]和蒙特卡洛梯度法[78]. 文獻(xiàn)[79]提出一種交替尋優(yōu)算法, 強(qiáng)制每一步的損失函數(shù)小于前一步, 并設(shè)置每次尋優(yōu)的最大迭代步數(shù)來減輕計(jì)算負(fù)擔(dān). 在每一步計(jì)算中, 減少可變參數(shù)的數(shù)量是提高計(jì)算效率的有效途徑. 例如在梯度下降法中減少待優(yōu)化變量數(shù)量可以減少每步求導(dǎo)的次數(shù)和復(fù)雜程度, 從而降低每步迭代的計(jì)算負(fù)擔(dān), 提高整體計(jì)算效率.

對(duì)于快變非線性批次過程, 現(xiàn)有的ILMPC算法難以同時(shí)兼顧最優(yōu)性和計(jì)算效率的問題. 以尋優(yōu)算法的內(nèi)在機(jī)制為切入點(diǎn), 對(duì)ILMPC的目標(biāo)函數(shù)結(jié)構(gòu)進(jìn)行改造以提高尋優(yōu)算法收斂速度或減小每步迭代的計(jì)算量, 是發(fā)展高效ILMPC的潛在方法.

批次過程“多重時(shí)變”的特點(diǎn)決定了其工況會(huì)隨批次或隨時(shí)間變化. ILMPC的時(shí)域滾動(dòng)優(yōu)化機(jī)制可以有效處理時(shí)變問題. 但是經(jīng)典ILMPC理論是基于批次過程的重復(fù)特性構(gòu)建的, 對(duì)于沿批次的變工況問題還沒有有效的解決方案. 在批次生產(chǎn)過程中, 產(chǎn)品類型或生產(chǎn)條件的改變會(huì)導(dǎo)致系統(tǒng)初始狀態(tài)、參考軌跡、批次長度和模型參數(shù)不斷發(fā)生變化[8]. 這造成ILMPC所依賴的對(duì)象重復(fù)性前提被打破, 難以發(fā)揮沿批次的學(xué)習(xí)作用. 為將ILMPC應(yīng)用于實(shí)際批次過程, 必須設(shè)法提高它對(duì)變初始狀態(tài)、變參考軌跡、變批次長度和變模型參數(shù)等工況的適應(yīng)能力. ILMPC理論的奠基者Lee早在2007年就明確指出, ILMPC研究的一個(gè)重要方向就是在變工況下實(shí)現(xiàn)批次間跟蹤誤差信息的有效轉(zhuǎn)換[17].

2.3.1   變初始狀態(tài)

現(xiàn)有的ILMPC算法大多要求系統(tǒng)的迭代初態(tài)在每一批次都嚴(yán)格定位在期望初態(tài)上, 從而實(shí)現(xiàn)對(duì)二維系統(tǒng)穩(wěn)定性的嚴(yán)格證明. 但是實(shí)際環(huán)境中的重復(fù)定位操作會(huì)導(dǎo)致系統(tǒng)存在初態(tài)偏移, 且每個(gè)批次的偏移量大小都是隨機(jī)的, 這直接影響到系統(tǒng)的時(shí)域閉環(huán)穩(wěn)定性和迭代域誤差收斂性. ILC通常只考慮沿批次的一維(One-dimensional, 1D)無約束學(xué)習(xí)律優(yōu)化, 可以直接將初始狀態(tài)偏差量或其范圍代入系統(tǒng)動(dòng)態(tài)方程, 獲得跟蹤誤差沿迭代軸漸近收斂的充分條件[80-82]. 文獻(xiàn)[83]基于2D Roesser模型對(duì)ILC系統(tǒng)在變初始狀態(tài)下的收斂性開展了理論分析, 證實(shí)了必定存在一種D型學(xué)習(xí)律使系統(tǒng)跟蹤誤差沿迭代軸漸近收斂至零. 文獻(xiàn)[84]進(jìn)一步證明了PD型學(xué)習(xí)律下ILC系統(tǒng)的跟蹤誤差在變初始狀態(tài)下必有界. 在此基礎(chǔ)上, 文獻(xiàn)[85]設(shè)計(jì)了一種自適應(yīng)ILC學(xué)習(xí)律, 使系統(tǒng)輸入同時(shí)根據(jù)離線數(shù)據(jù)和在線數(shù)據(jù)沿迭代軸進(jìn)行更新, 保證初始狀態(tài)有界時(shí)系統(tǒng)跟蹤誤差沿迭代軸漸近收斂至零. 與ILC策略不同, ILMPC在每個(gè)采樣時(shí)刻進(jìn)行滾動(dòng)時(shí)域優(yōu)化, 初始條件的變化會(huì)對(duì)約束系統(tǒng)的時(shí)域穩(wěn)定性產(chǎn)生很大影響, 進(jìn)而危及迭代收斂性. 若初始狀態(tài)在某一批次跳出被控系統(tǒng)吸引域, 該批次內(nèi)跟蹤誤差無法穩(wěn)定到最優(yōu)值. 基于不穩(wěn)定的前置控制經(jīng)驗(yàn), 后續(xù)批次的跟蹤精度和收斂速度都會(huì)明顯降低. 因此, 在系統(tǒng)初始狀態(tài)有界變化的情況下設(shè)計(jì)2D穩(wěn)定ILMPC策略十分必要.

2.3.2   變參考軌跡

在實(shí)際批次生產(chǎn)中, 同一生產(chǎn)線通常需要承擔(dān)不同種類、不同規(guī)格產(chǎn)品的生產(chǎn)任務(wù), 導(dǎo)致系統(tǒng)的參考軌跡會(huì)隨批次發(fā)生變化, 因此變參考軌跡問題一直是批次過程控制的研究熱點(diǎn). 對(duì)于具有2D結(jié)構(gòu)的ILMPC而言, 變參考軌跡帶來的影響不僅體現(xiàn)在迭代軸上, 還會(huì)沿時(shí)間方向持續(xù), 給ILMPC的系統(tǒng)性能分析帶來了很大困難. 相比之下, 采用沿批次的一維ILC控制, 只需在迭代方向上考慮參考軌跡變化量, 通過常規(guī)收斂性分析手段就可以推導(dǎo)出修正后的收斂性條件. 因此, 現(xiàn)有研究工作在變參考軌跡下的批次過程控制中基本都采用1D的改進(jìn)ILC方法. 文獻(xiàn)[86]針對(duì)隨機(jī)系統(tǒng)變軌跡跟蹤問題, 提出兩種自適應(yīng)ILC策略, 一是在控制器設(shè)計(jì)中選擇當(dāng)前批次的輸出軌跡與下一批次的參考軌跡的差值作為新的狀態(tài)變量, 另一種是在每一個(gè)批次的末尾利用卡爾曼濾波器重新進(jìn)行系統(tǒng)辨識(shí); 文獻(xiàn)[87]針對(duì)離散非線性系統(tǒng), 設(shè)計(jì)模糊自適應(yīng)ILC控制器, 通過不斷更新模糊參數(shù)來近似變參考軌跡下的系統(tǒng)動(dòng)態(tài); 文獻(xiàn)[25]設(shè)計(jì)基于數(shù)據(jù)驅(qū)動(dòng)的自適應(yīng)ILC控制器, 引入當(dāng)前批次的參考軌跡作為反饋, 并將過去批次的參考軌跡作為前饋以實(shí)現(xiàn)對(duì)變參考軌跡的跟蹤. 然而, 1D的ILC算法仍存在實(shí)時(shí)抗干擾能力差、無法保證時(shí)域穩(wěn)定性和收斂速度慢等弊端, 亟需探索能夠解決變參考軌跡跟蹤控制問題的2D穩(wěn)定ILMPC策略.

2.3.3   變批次長度

經(jīng)典批次過程控制假設(shè)每個(gè)批次的操作長度完全一致, 并基于此前提建立學(xué)習(xí)機(jī)制. 但在實(shí)際批次過程中, 生產(chǎn)周期改變、傳動(dòng)裝置誤差以及不可控人為因素都會(huì)導(dǎo)致批次長度沿批次不斷變化[88]. 變批次長度問題的關(guān)鍵在于對(duì)過程信息的整合. ILMPC依靠前一批次的控制經(jīng)驗(yàn)調(diào)整當(dāng)前批次的控制信號(hào). 當(dāng)相鄰批次的長度不等時(shí), 必然會(huì)出現(xiàn)信息過?;蛘咝畔⒉蛔愕那闆r, 需要進(jìn)行信息刪減或補(bǔ)償保證迭代學(xué)習(xí)沿批次按步推進(jìn). 近年來, 已有許多學(xué)者針對(duì)批次過程控制中的變批次長度問題開展了改進(jìn)的一維ILC算法研究. 為將各批次過程數(shù)據(jù)調(diào)整為相同長度, 文獻(xiàn)[88-95]設(shè)定所有缺失的誤差信息為零, 文獻(xiàn)[96-98]將批次終端的誤差信號(hào)延長至期望長度; 為綜合利用多歷史批次數(shù)據(jù), 文獻(xiàn)[88-91]引入了迭代平均算子, 利用歷史誤差數(shù)據(jù)的平均值更新ILC學(xué)習(xí)律; 文獻(xiàn)[94]采用高階學(xué)習(xí)結(jié)構(gòu), 根據(jù)多個(gè)歷史批次誤差數(shù)據(jù)和輸入數(shù)據(jù)的加權(quán)值更新控制律. 然而, 以上方法過多使用了控制效果較差的早期批次運(yùn)行數(shù)據(jù), 損失了迭代學(xué)習(xí)的最優(yōu)性. 對(duì)此, 文獻(xiàn)[99]提出一種基于改進(jìn)復(fù)合能量函數(shù)(Composite energy function, CEF)的迭代學(xué)習(xí)機(jī)制, 令控制系統(tǒng)在每個(gè)采樣時(shí)刻只根據(jù)具有充足過程信息的最近一個(gè)批次更新學(xué)習(xí)律, 實(shí)現(xiàn)了對(duì)新近批次的優(yōu)先學(xué)習(xí). 綜合來看, 現(xiàn)有的變長度批次過程控制方法仍然在如下方面需要改進(jìn): 首先, 已有誤差修正方法僅致力于構(gòu)造等長的批次數(shù)據(jù), 而忽視了補(bǔ)充信息精確性對(duì)系統(tǒng)學(xué)習(xí)性能的影響. 其次, 現(xiàn)有的學(xué)習(xí)結(jié)構(gòu)通常缺乏靈活性, 無法同時(shí)適應(yīng)學(xué)習(xí)數(shù)據(jù)為真實(shí)數(shù)據(jù)和補(bǔ)償數(shù)據(jù)的兩種情況. 利用ILMPC的時(shí)域預(yù)測(cè)功能能夠在變批次長度工況下對(duì)缺失誤差信息實(shí)現(xiàn)更為準(zhǔn)確的補(bǔ)償; 針對(duì)不同數(shù)據(jù)類型需設(shè)計(jì)多種學(xué)習(xí)結(jié)構(gòu), 有利于同時(shí)保證學(xué)習(xí)經(jīng)驗(yàn)的先進(jìn)性和實(shí)際性. 如何在2D框架下基于預(yù)測(cè)修正誤差進(jìn)行變學(xué)習(xí)模式的ILMPC系統(tǒng)性能分析將是此課題的研究難點(diǎn).

2.3.4   變模型參數(shù)

除了上述的初始狀態(tài)、參考軌跡和批次長度等外部條件, 批次過程自身的動(dòng)態(tài)特性也會(huì)改變, 通常體現(xiàn)為模型參數(shù)沿批次方向發(fā)生變化. ILMPC的二維預(yù)測(cè)和優(yōu)化高度依賴系統(tǒng)模型的一致性, 變模型參數(shù)會(huì)破壞ILMPC時(shí)域和迭代域上的遞歸可行性, 增大了ILMPC二維穩(wěn)定性分析的難度. 目前, 關(guān)于批次過程變模型參數(shù)控制的研究仍局限在ILC領(lǐng)域. 在模型參數(shù)已知或可估計(jì)的情況下, ILC可以通過在更新方程中直接代入變模型參數(shù)或其上界, 構(gòu)造自適應(yīng)或魯棒學(xué)習(xí)律提高算法適應(yīng)性, 并基于1D控制結(jié)構(gòu)推導(dǎo)出系統(tǒng)的顯式收斂條件. 文獻(xiàn)[100-103]均采用線性高階內(nèi)部模型(High-order internal model, HOIM)描述隨批次變化的系統(tǒng)動(dòng)態(tài)特性, 構(gòu)造自適應(yīng)ILC策略得到系統(tǒng)的漸近收斂條件; 文獻(xiàn)[104-106]和文獻(xiàn)[107]分別就變參數(shù)狀態(tài)空間模型和變參數(shù)輸入輸出模型給出了線性系統(tǒng)在一般開環(huán)學(xué)習(xí)律控制下的有界條件和收斂條件; 文獻(xiàn)[108]結(jié)合廣義擴(kuò)展?fàn)顟B(tài)觀測(cè)器(Generalized extended state observer, GESO), 基于變參數(shù)線性狀態(tài)空間模型設(shè)計(jì)二自由度閉環(huán)魯棒ILC策略, 保證了系統(tǒng)跟蹤誤差的有界性. 借鑒ILC領(lǐng)域的理論成果, 在ILMPC中設(shè)計(jì)自適應(yīng)和魯棒控制結(jié)構(gòu)將是處理變模型參數(shù)問題的可行方案. 然而, 在改進(jìn)ILMPC結(jié)構(gòu)中如何確保二維遞歸可行并盡可能降低系統(tǒng)保守性仍是一個(gè)頗具難度的復(fù)雜問題.

綜上, ILMPC特有的二維控制結(jié)構(gòu)給其建模、優(yōu)化和穩(wěn)定性都帶來了巨大挑戰(zhàn)(如圖6所示). 在建模中實(shí)現(xiàn)多階段迭代誤差估計(jì)和補(bǔ)償, 在優(yōu)化中實(shí)現(xiàn)最優(yōu)性和計(jì)算效率的平衡, 在穩(wěn)定性分析中突破嚴(yán)重復(fù)性條件的桎梏, 是ILMPC理論中亟待解決的三個(gè)關(guān)鍵科學(xué)問題.

圖 6  ILMPC的挑戰(zhàn)
Fig. 6  Challenges of ILMPC

隨著控制工程界對(duì)批次過程與連續(xù)過程的界定愈加清晰, 在過去20年間迭代學(xué)習(xí)模型預(yù)測(cè)控制立足于批次過程特有的“多重時(shí)變”性質(zhì)向著更深的理論層次發(fā)展. ILMPC二維時(shí)變框架下的建模、優(yōu)化及適應(yīng)性等瓶頸問題都得到了越來越多的關(guān)注, 衍生了一系列優(yōu)秀的階段性成果. 總體來看, ILMPC當(dāng)前研究工作主要集中于兩個(gè)方向:

1) 由基于機(jī)理模型的ILMPC向基于數(shù)據(jù)模型的ILMPC過渡. ILC作為無模型算法, 通過學(xué)習(xí)積累的歷史批次數(shù)據(jù)實(shí)現(xiàn)對(duì)參考軌跡的高精度跟蹤, 實(shí)際上是一種數(shù)據(jù)驅(qū)動(dòng)控制策略. 而MPC作為一種基于預(yù)測(cè)模型的優(yōu)化控制算法, 其時(shí)域控制效果很大程度上依賴于對(duì)系統(tǒng)動(dòng)態(tài)模型的精確掌握. ILMPC繼承了ILC的學(xué)習(xí)能力和MPC的時(shí)域魯棒性, 但同時(shí)也丟失了ILC不依賴控制對(duì)象模型的優(yōu)勢(shì). 當(dāng)被控批次過程具有復(fù)雜非線性特征, 難以建立精確機(jī)理模型時(shí), 經(jīng)典ILMPC的實(shí)施面臨很大困難. 隨著機(jī)器學(xué)習(xí)在本世紀(jì)的井噴式發(fā)展, 很多學(xué)者開始利用神經(jīng)網(wǎng)絡(luò)和強(qiáng)化學(xué)習(xí)等方法對(duì)ILMPC的控制結(jié)構(gòu)進(jìn)行轉(zhuǎn)化, 建立數(shù)據(jù)驅(qū)動(dòng)ILMPC算法, 直接基于歷史數(shù)據(jù)辨識(shí)被控系統(tǒng)的2D動(dòng)態(tài)特性用于時(shí)域預(yù)測(cè), 打破了模型預(yù)知這一嚴(yán)苛條件對(duì)ILMPC理論深化和應(yīng)用拓展的束縛.

2) 對(duì)已有的ILMPC理論進(jìn)行擴(kuò)展和改進(jìn), 使其滿足批次過程在承擔(dān)不同生產(chǎn)任務(wù)時(shí)的特殊需求. 批次過程類型眾多、生產(chǎn)條件各異, 從系統(tǒng)動(dòng)態(tài)上可分為快時(shí)變和慢時(shí)變, 從運(yùn)行條件上可分為設(shè)計(jì)工況和變工況. 對(duì)于快時(shí)變批次過程, 需要在ILMPC設(shè)計(jì)中關(guān)注控制器的計(jì)算效率問題, 確保控制的實(shí)時(shí)性. 對(duì)于存在變初始狀態(tài)、變參考軌跡、變批次長度以及變模型參數(shù)等變工況擾動(dòng)的批次過程, 必須在ILMPC設(shè)計(jì)中解決其引發(fā)的系統(tǒng)不確定性問題. 近年來, ILMPC研究領(lǐng)域的學(xué)者利用魯棒、自適應(yīng)、模糊、神經(jīng)網(wǎng)絡(luò)以及預(yù)測(cè)函數(shù)等先進(jìn)技術(shù), 對(duì)經(jīng)典ILMPC框架進(jìn)行了系統(tǒng)而深入的改進(jìn), 針對(duì)性地解決了實(shí)際批次過程的控制需求, 極大地豐富了ILMPC的理論體系和應(yīng)用場(chǎng)景.

隨著工業(yè)過程的生產(chǎn)規(guī)模及結(jié)構(gòu)復(fù)雜性不斷增長, 許多批次過程呈現(xiàn)出強(qiáng)非線性動(dòng)態(tài)特性, 難以通過分析生產(chǎn)過程的內(nèi)部機(jī)制或者物質(zhì)流的傳遞機(jī)理獲取其精確機(jī)理模型. 近年來, 直接利用離線數(shù)據(jù)進(jìn)行優(yōu)化控制的方法備受關(guān)注. 在當(dāng)前階段, 數(shù)據(jù)驅(qū)動(dòng)迭代學(xué)習(xí)模型預(yù)測(cè)控制的研究方向大致分為兩類:

1) 基于批次過程不斷產(chǎn)生的有限時(shí)域過程數(shù)據(jù)利用神經(jīng)網(wǎng)絡(luò)沿迭代軸辨識(shí)系統(tǒng)的二維預(yù)測(cè)模型, 再基于神經(jīng)網(wǎng)絡(luò)模型進(jìn)行ILMPC的優(yōu)化求解. 針對(duì)仿射型非線性批次過程, 文獻(xiàn)[56]采用控制仿射型前饋神經(jīng)網(wǎng)絡(luò)(Control affine feedforward neural network, CAFNN)對(duì)復(fù)雜非線性批次過程的重復(fù)動(dòng)態(tài)特性進(jìn)行迭代建模, 構(gòu)建基于Tube的數(shù)據(jù)驅(qū)動(dòng)ILMPC, 保證在存在建模誤差時(shí)系統(tǒng)跟蹤軌跡能夠收斂至參考軌跡附近的不變集內(nèi); 針對(duì)非仿射型非線性批次過程, 文獻(xiàn)[73]采用了徑向基(Radial basis function, RBF)神經(jīng)網(wǎng)絡(luò)對(duì)其動(dòng)態(tài)特性進(jìn)行辨識(shí), 并在數(shù)據(jù)驅(qū)動(dòng)ILMPC中結(jié)合CEF實(shí)現(xiàn)建模誤差和跟蹤誤差沿迭代軸的收斂.

2) 直接利用系統(tǒng)離線數(shù)據(jù)擬合每個(gè)批次內(nèi)輸入序列與輸出序列間的轉(zhuǎn)移矩陣, 基于所得輸入輸出模型對(duì)未來多個(gè)批次的輸出序列進(jìn)行預(yù)測(cè). 文獻(xiàn)[109-110]針對(duì)預(yù)測(cè)所需未來批次過程動(dòng)態(tài)無法獲得的難題, 提出了一種基于不斷積累的批次過程離線數(shù)據(jù)估計(jì)未來批次系統(tǒng)轉(zhuǎn)移矩陣的新算法, 成功構(gòu)造了沿迭代軸的數(shù)據(jù)驅(qū)動(dòng)ILMPC策略; 文獻(xiàn)[30]考慮批次過程不確定性未知的情況, 利用離線數(shù)據(jù)中包含的過程信息對(duì)未來批次的系統(tǒng)整體動(dòng)態(tài)進(jìn)行預(yù)測(cè), 消除不確定項(xiàng)對(duì)ILMPC跟蹤性能的影響.

為了適應(yīng)工業(yè)機(jī)器人[111]、運(yùn)載工具[112]以及快速化學(xué)反應(yīng)器[113]等快動(dòng)態(tài)非線性批次過程的高效率控制需求, 建立計(jì)算負(fù)擔(dān)低的優(yōu)化控制策略也是現(xiàn)今ILMPC領(lǐng)域的研究熱點(diǎn)之一. 通常采用的手段是將控制對(duì)象復(fù)雜的非線性動(dòng)態(tài)表征為線性形式, 從而實(shí)現(xiàn)非凸優(yōu)化問題到凸優(yōu)化問題的轉(zhuǎn)化, 降低優(yōu)化求解的在線計(jì)算量. 文獻(xiàn)[114]介紹了一種即時(shí)學(xué)習(xí)(Just-in-time-learning, JITL)方法, 根據(jù)輸入輸出數(shù)據(jù)將非線性模型沿標(biāo)稱軌跡線性化, 建立線性時(shí)變參數(shù)模型; 文獻(xiàn)[115]直接沿參考軌跡通過泰勒展開線性化非線性模型, 并在控制器設(shè)計(jì)中對(duì)線性化高階項(xiàng)誤差進(jìn)行補(bǔ)償, 能夠同時(shí)保證計(jì)算效率和跟蹤精度.

此外, 降低待優(yōu)化變量維數(shù)也是提高控制效率的有效途徑之一. 文獻(xiàn)[115-116]在時(shí)域控制上采用了具有特殊結(jié)構(gòu)的預(yù)測(cè)函數(shù)控制, 通過將待優(yōu)化變量表示為一系列基函數(shù)的加權(quán)和, 將維數(shù)較高的控制時(shí)域輸入序列求解問題轉(zhuǎn)變?yōu)榫S數(shù)較低的基函數(shù)權(quán)重系數(shù)序列求解問題, 從而顯著提高在線求解速度.

變工況控制是拓展ILMPC策略應(yīng)用范圍必須克服的難點(diǎn)問題. 隨著經(jīng)典ILMPC理論逐漸發(fā)展成熟, 近幾年來變初始條件、變參考軌跡以及變批次長度等工程實(shí)踐問題受到越來越多專家學(xué)者的關(guān)注, 打破經(jīng)典ILMPC要求各批次工況完全一致帶來的應(yīng)用桎梏已成為當(dāng)前研究亟需解決的問題.

針對(duì)變初始條件問題, 通常有兩種解決思路. 一是構(gòu)造基于終端約束的ILMPC策略[117], 利用可行初始狀態(tài)軌跡計(jì)算控制器的終端約束集及終端代價(jià)函數(shù), 并通過迭代逐步提高控制最優(yōu)性; 二是先采用固定初態(tài)的系統(tǒng)方程進(jìn)行二維預(yù)測(cè), 再通過系統(tǒng)真實(shí)輸出與預(yù)測(cè)輸出的差值數(shù)據(jù)對(duì)控制律更新方程不斷修正[118].

有關(guān)變參考軌跡的ILMPC研究工作主要分為兩個(gè)方向: 經(jīng)過固定期望點(diǎn)的變參考軌跡跟蹤控制和全區(qū)間變參考軌跡跟蹤控制. 前一研究方向針對(duì)只需在部分采樣點(diǎn)跟蹤參考值的特定批次過程, 設(shè)定系統(tǒng)參考軌跡為穿越各個(gè)期望點(diǎn)的隨機(jī)軌跡, 將參考軌跡跟蹤問題縮小為固定點(diǎn)跟蹤問題, 通過建立點(diǎn)對(duì)點(diǎn)ILMPC策略[51119], 保證系統(tǒng)對(duì)期望點(diǎn)的跟蹤精度; 后一研究方向針對(duì)參考軌跡全工作區(qū)間變化的一般情況, 將其變化量表示為ILMPC的迭代擾動(dòng)項(xiàng), 結(jié)合魯棒控制技術(shù)加以抑制[120-121], 保證系統(tǒng)對(duì)整個(gè)參考軌跡的跟蹤精度.

ILMPC算法的核心思想是在滾動(dòng)時(shí)域下基于前一批次的控制經(jīng)驗(yàn)對(duì)當(dāng)前批次的控制輸入進(jìn)行校正, 其中隱含了相鄰批次等長的條件. 變批次長度打破了迭代學(xué)習(xí)功能依賴的基本前提, 給ILMPC的2D遞歸可行性和穩(wěn)定性分析帶來了巨大挑戰(zhàn). 因此, 變批次長度是實(shí)現(xiàn)ILMPC所面臨的最嚴(yán)峻的變工況問題, 目前還沒有建立與之相對(duì)應(yīng)的完善的ILMPC策略. 文獻(xiàn)[122]中討論了一種具有預(yù)測(cè)功能的改進(jìn)ILC策略, 通過建立系統(tǒng)輸入輸出預(yù)測(cè)模型, 采用預(yù)測(cè)值對(duì)數(shù)據(jù)缺失的批次進(jìn)行補(bǔ)充, 將每一批次的過程數(shù)據(jù)重構(gòu)為相等長度. 這為在ILMPC中建立缺失信息預(yù)測(cè)補(bǔ)償機(jī)制提供了參考, 在此基礎(chǔ)上繼續(xù)探索變批次長度下的多學(xué)習(xí)模式和2D性能分析方法是當(dāng)今ILMPC的理論研究新趨勢(shì).

迭代學(xué)習(xí)模型預(yù)測(cè)控制理論正朝著無模型、強(qiáng)魯棒性、強(qiáng)適應(yīng)性的方向迅速發(fā)展, 這為其在實(shí)際工業(yè)過程中的應(yīng)用提供了有力支撐. 截至目前, ILMPC策略已在化工[123-127]、電力[46]、供熱[128]、醫(yī)療[129-131]、精密儀器[132]等多個(gè)領(lǐng)域取得成功應(yīng)用. 香港科技大學(xué)高福榮教授團(tuán)隊(duì)在注塑過程迭代學(xué)習(xí)模型預(yù)測(cè)控制方面開展了卓有成效的研究工作[4750123], 實(shí)現(xiàn)了對(duì)注射速度的精準(zhǔn)控制, 提升了注塑產(chǎn)品質(zhì)量和生產(chǎn)效益. 山東科技大學(xué)王友清教授團(tuán)隊(duì)將ILMPC成功應(yīng)用于人工胰臟智能控制[129-131], 根據(jù)患者血糖動(dòng)態(tài)變化實(shí)時(shí)調(diào)節(jié)胰島素注射速度.

ILMPC的實(shí)際應(yīng)用不僅限于化學(xué)反應(yīng)器、注塑機(jī)、機(jī)械手臂等典型間歇過程, 也廣泛滲透于發(fā)電、供熱、煉鋼等典型連續(xù)過程. 對(duì)于動(dòng)態(tài)變化具有重復(fù)性的連續(xù)過程, 可以對(duì)其操作流程進(jìn)行人為的周期劃分, 構(gòu)造ILMPC所需的“迭代軸”. 目前, 基于模糊建模的ILMPC已應(yīng)用至火力發(fā)電控制[46], 通過迭代學(xué)習(xí)周期性歷史數(shù)據(jù)保證了對(duì)負(fù)荷指令的快速、準(zhǔn)確跟蹤. 這種周期劃分方法打破了迭代學(xué)習(xí)模型預(yù)測(cè)控制與連續(xù)過程間的應(yīng)用屏障, ILMPC將向著應(yīng)用場(chǎng)景多樣化、應(yīng)用形式靈活化的方向繼續(xù)發(fā)展.

作為智能制造的重要生產(chǎn)方式, 批次過程的最終控制目標(biāo)是保證各批次持續(xù)產(chǎn)出高質(zhì)量成品, 提高經(jīng)濟(jì)效益和社會(huì)效益. 結(jié)合迭代學(xué)習(xí)模型預(yù)測(cè)控制的發(fā)展現(xiàn)狀和批次過程控制的特殊需求, ILMPC的未來研究工作需要在解決復(fù)雜非線性建模、2D高效優(yōu)化以及變工況適應(yīng)性的基礎(chǔ)上綜合考慮批次生產(chǎn)過程的經(jīng)濟(jì)性問題, 其途徑主要包含兩個(gè)層面: 設(shè)計(jì)成品質(zhì)量預(yù)測(cè)和控制策略、建立二維動(dòng)態(tài)經(jīng)濟(jì)優(yōu)化機(jī)制.

實(shí)際批次過程通常無法直接監(jiān)測(cè)產(chǎn)品質(zhì)量, 大多通過測(cè)量溫度、壓力等過程參量并令其跟蹤預(yù)設(shè)的變化軌跡保證成品質(zhì)量. 因此, ILMPC自誕生以來大都以跟蹤預(yù)定軌跡為控制目標(biāo). 但是各批次間配料和進(jìn)程的偏差以及隨機(jī)干擾都會(huì)導(dǎo)致既定的參考軌跡不再具有質(zhì)量最優(yōu)性. 在ILMPC基礎(chǔ)上建立質(zhì)量評(píng)價(jià)體系, 沿時(shí)間軸同時(shí)進(jìn)行系統(tǒng)輸出序列和成品質(zhì)量預(yù)測(cè), 共同優(yōu)化參考軌跡跟蹤性能和成品質(zhì)量指標(biāo), 能夠?qū)崿F(xiàn)對(duì)批次過程產(chǎn)品質(zhì)量的實(shí)時(shí)調(diào)控. 基于此思想, 韓國學(xué)者Lee等提出了早期的質(zhì)量批次模型預(yù)測(cè)控制(Quality BMPC, QBMPC)策略[133-135], 利用推斷控制技術(shù)推導(dǎo)在線過程可測(cè)變量與成品質(zhì)量間的相關(guān)性模型(又稱軟傳感器), 并將其與系統(tǒng)動(dòng)態(tài)模型組合形成增廣預(yù)測(cè)模型, 實(shí)現(xiàn)對(duì)成品質(zhì)量的實(shí)時(shí)預(yù)測(cè)和優(yōu)化(圖7). 該策略在甲基丙烯酸甲酯(Methyl methacrylate, MMA)聚合反應(yīng)控制中取得成功應(yīng)用[136].

圖 7  QBMPC結(jié)構(gòu)
Fig. 7  Scheme of QBMPC

然而, 批次過程的成品質(zhì)量與過程因素及環(huán)境因素都存在著錯(cuò)綜復(fù)雜的關(guān)系, 無論是線性相關(guān)模型還是非線性回歸模型都難以對(duì)其進(jìn)行可靠、準(zhǔn)確的預(yù)測(cè), 這導(dǎo)致QBMPC的研究熱潮僅在本世紀(jì)初曇花一現(xiàn), 隨后便一直處于發(fā)展停滯狀態(tài). 現(xiàn)今工業(yè)大數(shù)據(jù)及人工智能技術(shù)的迅速崛起有望為QBMPC注入新的活力, 依靠實(shí)際批次過程豐富的數(shù)據(jù)支持和神經(jīng)網(wǎng)絡(luò)強(qiáng)大的辨識(shí)能力, 建立精確的成品質(zhì)量預(yù)測(cè)模型將不再是難題, 高度發(fā)展的數(shù)據(jù)驅(qū)動(dòng)建模技術(shù)將使QBMPC策略重新成為批次過程控制領(lǐng)域的研究熱點(diǎn).

為實(shí)現(xiàn)運(yùn)行優(yōu)化與反饋控制的有效結(jié)合[137-138], 實(shí)際批次過程通常采用分層控制結(jié)構(gòu)[139-140], 如圖8(a)所示. 在實(shí)時(shí)優(yōu)化層(Real-time optimization, RTO)優(yōu)化經(jīng)濟(jì)性能指標(biāo)獲得最優(yōu)參考軌跡, 再將參考軌跡傳遞給動(dòng)態(tài)控制層進(jìn)行跟蹤控制. ILMPC策略通常應(yīng)用于動(dòng)態(tài)控制層, 利用其迭代學(xué)習(xí)和滾動(dòng)優(yōu)化的特點(diǎn), 實(shí)現(xiàn)對(duì)參考軌跡的高精度穩(wěn)定跟蹤. 然而, 這種分層結(jié)構(gòu)只在上層考慮了系統(tǒng)經(jīng)濟(jì)性能, 丟失了動(dòng)態(tài)跟蹤過程中的經(jīng)濟(jì)信息. 當(dāng)被控過程出現(xiàn)模型失配、隨機(jī)干擾等不確定性時(shí), 上層優(yōu)化得到的參考軌跡不再是動(dòng)態(tài)跟蹤過程的經(jīng)濟(jì)最優(yōu)軌跡.

圖 8  傳統(tǒng)分層控制結(jié)構(gòu)與ILEMPC結(jié)構(gòu)對(duì)比
Fig. 8  Comparison of hierarchical control structure and ILEMPC structure

經(jīng)濟(jì)模型預(yù)測(cè)控制(Economic model predictive control, EMPC)將實(shí)時(shí)優(yōu)化和動(dòng)態(tài)控制融合在一個(gè)框架下實(shí)現(xiàn), 直接采用經(jīng)濟(jì)性能指標(biāo)作為動(dòng)態(tài)跟蹤問題的目標(biāo)函數(shù), 可以有效提高系統(tǒng)動(dòng)態(tài)經(jīng)濟(jì)性能[141-143]. 近期, 許多學(xué)者開始嘗試將EMPC理念與傳統(tǒng)ILMPC結(jié)合[144-147], 形成了迭代學(xué)習(xí)經(jīng)濟(jì)模型預(yù)測(cè)控制(Iterative learning economic model predictive control, ILEMPC), 它通過優(yōu)化基于前次迭代數(shù)據(jù)的滾動(dòng)時(shí)域經(jīng)濟(jì)性能指標(biāo)獲得每一時(shí)刻的控制輸入, 其結(jié)構(gòu)如圖8(b)所示. 與經(jīng)典ILMPC沿迭代軸提高跟蹤精度不同, ILEMPC沿迭代軸直接實(shí)現(xiàn)系統(tǒng)經(jīng)濟(jì)性能的穩(wěn)步提升, 目前已在間歇化學(xué)反應(yīng)器[145-146]和太陽能熱水器[148]控制中取得成功應(yīng)用.

然而, 作為一種新興控制結(jié)構(gòu), ILEMPC在控制性能定性分析方面還存在明顯欠缺. 首先, 經(jīng)濟(jì)目標(biāo)函數(shù)通常具有非二次型形式, 使得傳統(tǒng)的終端約束集方法無法保證系統(tǒng)的時(shí)域Lyapunov穩(wěn)定性, 進(jìn)而會(huì)影響迭代收斂性. 如何將EMPC的穩(wěn)定性理論(如基于強(qiáng)耗散性的終端約束EMPC[142]、基于Lyapunov收縮約束的雙模EMPC[149])運(yùn)用至二維的ILEMPC系統(tǒng)是未來研究的重要內(nèi)容; 其次, 與傳統(tǒng)ILMPC算法需保證跟蹤誤差沿迭代軸收斂至最小值不同, ILEMPC追求的是動(dòng)態(tài)經(jīng)濟(jì)性能沿迭代軸收斂至最優(yōu). 對(duì)于各類批次過程如何設(shè)定經(jīng)濟(jì)目標(biāo)函數(shù)并建立合理的經(jīng)濟(jì)性能迭代分析方案是ILEMPC在未來發(fā)展中必須解決的關(guān)鍵問題.

總體來說, ILMPC理論在過去20多年間呈現(xiàn)快速發(fā)展趨勢(shì), 在變工況適應(yīng)性、魯棒性、控制效率等方面已取得矚目成績, 在經(jīng)濟(jì)性方面正以完善理論體系、拓寬應(yīng)用范圍為目標(biāo)逐步深入. 未來ILMPC的理論研究需緊密跟隨批次過程智能化、精細(xì)化的趨勢(shì), 在深化迭代學(xué)習(xí)功能的同時(shí)加強(qiáng)與工業(yè)大數(shù)據(jù)的交互, 汲取工業(yè)控制領(lǐng)域與其他交叉學(xué)科的最新成果, 實(shí)現(xiàn)在精度、靈活性、安全性、高效性等控制性能上的不斷提升, 并兼顧對(duì)現(xiàn)有2D穩(wěn)定性分析方法的拓展和突破.


關(guān)鍵字:優(yōu)秀論文

網(wǎng)絡(luò)客服QQ: 沈編輯

投訴建議:0373-5939925????投訴建議QQ:

招聘合作:2851259250@qq.com (如您是期刊主編、文章高手,可通過郵件合作)

地址:河南省新鄉(xiāng)市金穗大道東段266號(hào)中州期刊聯(lián)盟 ICP備案號(hào):豫ICP備2020036848

【免責(zé)聲明】:中州期刊聯(lián)盟所提供的信息資源如有侵權(quán)、違規(guī),請(qǐng)及時(shí)告知。

版權(quán)所有:中州期刊聯(lián)盟(新鄉(xiāng)市博翰文化傳媒有限公司)

關(guān)注”中州期刊聯(lián)盟”公眾號(hào)
了解論文寫作全系列課程

核心期刊為何難發(fā)?

論文發(fā)表總嫌貴?

職院?jiǎn)挝话l(fā)核心?

掃描關(guān)注公眾號(hào)

論文發(fā)表不再有疑惑

論文寫作全系列課程

掃碼了解更多

輕松寫核心期刊論文

在線留言