您的位置:網(wǎng)站首頁 > 優(yōu)秀論文 > 正文
演化博弈的分析范式與占優(yōu)的跟風(fēng)策略——河北經(jīng)貿(mào)大學(xué)學(xué)報(bào)
作者:陳博來源:原創(chuàng)日期:2013-09-14人氣:1010
演化博弈理論是研究群體進(jìn)化的一種動(dòng)態(tài)方法,其研究對(duì)象是頻率制約選擇下的進(jìn)化動(dòng)態(tài)。其中,個(gè)體的適應(yīng)度并非常數(shù),而是依賴于不同表現(xiàn)型在群體中所占的比例。演化博弈理論源于博弈論與生物學(xué)之間的互動(dòng):首先,生物學(xué)家嘗試運(yùn)用博弈論建構(gòu)各種生物競(jìng)爭(zhēng)演化模型,比如生存競(jìng)爭(zhēng)、性別比例等;[23]然后,生物學(xué)家將種群思想引入博弈論之中,比如適應(yīng)度概念、進(jìn)化穩(wěn)定策略、復(fù)制方程等;[24]最后,經(jīng)濟(jì)學(xué)家借鑒生物學(xué)家提出的理論,繼續(xù)發(fā)展了演化博弈,從演化穩(wěn)定均衡擴(kuò)展到隨機(jī)穩(wěn)定均衡。不論演化博弈理論如何發(fā)展,獨(dú)特的分析范式是其核心特征。
(一)演化博弈的分析范式
2. 演化穩(wěn)定策略。演化穩(wěn)定策略(ESS,Evolutionarily Stable Strategy)是演化博弈中一個(gè)非常關(guān)鍵的概念。[25]其核心思想是,如果一個(gè)現(xiàn)存策略是演化穩(wěn)定策略,那么,必須存在一個(gè)正的進(jìn)入障礙,使得當(dāng)變異策略的頻率低于這個(gè)障礙時(shí),現(xiàn)存的策略能夠比變異策略獲得更高的收益[26]。假設(shè)現(xiàn)存策略為x,變異策略為y,而變異者進(jìn)入后占總體的比例為?著(0<?著<1)。在這個(gè)雙態(tài)總體中,現(xiàn)存策略進(jìn)入后的支付為u(x,?棕),變異策略進(jìn)入后的支付為u(y,?棕)。若u[x,?著y+(1-?著)x]>u[y,?著y+(1-?著)x],則現(xiàn)存策略x被稱為演化穩(wěn)定策略。[27]因此,演化方法關(guān)注的是單個(gè)大總體中的對(duì)稱配對(duì)博弈,即側(cè)重兩個(gè)策略之間互動(dòng)關(guān)系,而不涉及兩個(gè)以上的多態(tài)個(gè)體間的博弈。此外,演化穩(wěn)定性并未解釋策略的來源,只是檢驗(yàn)策略一旦出現(xiàn),在演化壓力下是不是穩(wěn)定。所以,從本質(zhì)上來看,演化穩(wěn)定性是每次只針對(duì)一個(gè)變異的穩(wěn)定性檢驗(yàn),強(qiáng)調(diào)的是變異的作用。
3. 復(fù)制動(dòng)態(tài)方程。演化過程是兩個(gè)基本要素的組合:一個(gè)是產(chǎn)生多樣性的變異機(jī)制;一個(gè)是傾向一些種類的選擇機(jī)制。演化穩(wěn)定性強(qiáng)調(diào)變異的作用,即個(gè)體策略的隨機(jī)變動(dòng),而復(fù)制動(dòng)態(tài)強(qiáng)調(diào)的則是選擇的作用。(二)占優(yōu)的跟風(fēng)策略
一種人類行為如果經(jīng)歷了漫長(zhǎng)的演化過程,即經(jīng)過變異的入侵檢驗(yàn)和選擇的動(dòng)態(tài)復(fù)制,能夠生存下來。那么,就可以說這種人類行為是演化穩(wěn)定的。通過前面的分析可知,要想揭示強(qiáng)互惠行為的內(nèi)生性和生物理性本質(zhì),必須從演化的視角進(jìn)行解讀。那么,在演化博弈中應(yīng)該如何來解釋強(qiáng)互惠行為呢?對(duì)這一問題的回答可以從演化博弈中的關(guān)鍵性概念“跟風(fēng)策略”開始。
跟風(fēng)策略(TFF,Tit for Tat)又稱“一報(bào)還一報(bào)”策略,即開始時(shí)選擇合作,然后不斷重復(fù)對(duì)方上一步的選擇。[29]它是由多倫多大學(xué)博弈論專家阿納托爾·拉帕波特(Anatol Rapoport)在羅伯特·阿克塞爾羅德(Robert Axelrod)重復(fù)囚徒困境計(jì)算機(jī)競(jìng)賽中提出的一個(gè)博弈策略。阿克塞爾羅德在20世紀(jì)末進(jìn)行了三次計(jì)算機(jī)模擬實(shí)驗(yàn),目的在于探討人類合作能否從有著自己利益最大化推理邏輯的行動(dòng)者的行為互動(dòng)中自發(fā)產(chǎn)生。在第一次實(shí)驗(yàn)中,共有15種策略參賽、225場(chǎng)比賽,模擬結(jié)果顯示,跟風(fēng)策略平均得分504.5,即基準(zhǔn)分600的84%,排名第一;在第二次實(shí)驗(yàn)中,阿克塞爾羅德將參賽策略增加到63個(gè),并將第一次實(shí)驗(yàn)的結(jié)果告知參賽者,模擬結(jié)果顯示,跟風(fēng)策略平均得分為基準(zhǔn)分的96%,在此排名第一;在第三次實(shí)驗(yàn)中,阿克塞爾羅德并未增加新的策略,而是從演化博弈的角度出發(fā),試圖發(fā)現(xiàn)史密斯的“演化穩(wěn)定策略”(ESS),模擬結(jié)果表明,跟風(fēng)策略在演化迭代中依舊表現(xiàn)出色,而“詭詐型”策略在200代以后完全消失。通過三次重復(fù)囚徒困境博弈實(shí)驗(yàn),阿克塞爾羅德發(fā)現(xiàn):跟風(fēng)策略穩(wěn)定成功的原因在于它綜合了善良性、報(bào)復(fù)性和寬容性。[30]善良性,即從不首先背叛;報(bào)復(fù)性,也稱可激怒性,即對(duì)方若背叛,則自己將在下輪對(duì)其懲罰;寬容性,即一旦“改過”,自己以合作對(duì)待。正是這三種特性保證了跟風(fēng)策略在與各種策略的博弈過程中能夠獲得較高的平均支付,具有較強(qiáng)的適應(yīng)性,即跟風(fēng)策略具有演化穩(wěn)定性。正如生物學(xué)家道金斯所說,即使有自私的基因掌權(quán)控制,好人仍能得好報(bào)。[31]
(一)演化博弈的分析范式
2. 演化穩(wěn)定策略。演化穩(wěn)定策略(ESS,Evolutionarily Stable Strategy)是演化博弈中一個(gè)非常關(guān)鍵的概念。[25]其核心思想是,如果一個(gè)現(xiàn)存策略是演化穩(wěn)定策略,那么,必須存在一個(gè)正的進(jìn)入障礙,使得當(dāng)變異策略的頻率低于這個(gè)障礙時(shí),現(xiàn)存的策略能夠比變異策略獲得更高的收益[26]。假設(shè)現(xiàn)存策略為x,變異策略為y,而變異者進(jìn)入后占總體的比例為?著(0<?著<1)。在這個(gè)雙態(tài)總體中,現(xiàn)存策略進(jìn)入后的支付為u(x,?棕),變異策略進(jìn)入后的支付為u(y,?棕)。若u[x,?著y+(1-?著)x]>u[y,?著y+(1-?著)x],則現(xiàn)存策略x被稱為演化穩(wěn)定策略。[27]因此,演化方法關(guān)注的是單個(gè)大總體中的對(duì)稱配對(duì)博弈,即側(cè)重兩個(gè)策略之間互動(dòng)關(guān)系,而不涉及兩個(gè)以上的多態(tài)個(gè)體間的博弈。此外,演化穩(wěn)定性并未解釋策略的來源,只是檢驗(yàn)策略一旦出現(xiàn),在演化壓力下是不是穩(wěn)定。所以,從本質(zhì)上來看,演化穩(wěn)定性是每次只針對(duì)一個(gè)變異的穩(wěn)定性檢驗(yàn),強(qiáng)調(diào)的是變異的作用。
3. 復(fù)制動(dòng)態(tài)方程。演化過程是兩個(gè)基本要素的組合:一個(gè)是產(chǎn)生多樣性的變異機(jī)制;一個(gè)是傾向一些種類的選擇機(jī)制。演化穩(wěn)定性強(qiáng)調(diào)變異的作用,即個(gè)體策略的隨機(jī)變動(dòng),而復(fù)制動(dòng)態(tài)強(qiáng)調(diào)的則是選擇的作用。(二)占優(yōu)的跟風(fēng)策略
一種人類行為如果經(jīng)歷了漫長(zhǎng)的演化過程,即經(jīng)過變異的入侵檢驗(yàn)和選擇的動(dòng)態(tài)復(fù)制,能夠生存下來。那么,就可以說這種人類行為是演化穩(wěn)定的。通過前面的分析可知,要想揭示強(qiáng)互惠行為的內(nèi)生性和生物理性本質(zhì),必須從演化的視角進(jìn)行解讀。那么,在演化博弈中應(yīng)該如何來解釋強(qiáng)互惠行為呢?對(duì)這一問題的回答可以從演化博弈中的關(guān)鍵性概念“跟風(fēng)策略”開始。
跟風(fēng)策略(TFF,Tit for Tat)又稱“一報(bào)還一報(bào)”策略,即開始時(shí)選擇合作,然后不斷重復(fù)對(duì)方上一步的選擇。[29]它是由多倫多大學(xué)博弈論專家阿納托爾·拉帕波特(Anatol Rapoport)在羅伯特·阿克塞爾羅德(Robert Axelrod)重復(fù)囚徒困境計(jì)算機(jī)競(jìng)賽中提出的一個(gè)博弈策略。阿克塞爾羅德在20世紀(jì)末進(jìn)行了三次計(jì)算機(jī)模擬實(shí)驗(yàn),目的在于探討人類合作能否從有著自己利益最大化推理邏輯的行動(dòng)者的行為互動(dòng)中自發(fā)產(chǎn)生。在第一次實(shí)驗(yàn)中,共有15種策略參賽、225場(chǎng)比賽,模擬結(jié)果顯示,跟風(fēng)策略平均得分504.5,即基準(zhǔn)分600的84%,排名第一;在第二次實(shí)驗(yàn)中,阿克塞爾羅德將參賽策略增加到63個(gè),并將第一次實(shí)驗(yàn)的結(jié)果告知參賽者,模擬結(jié)果顯示,跟風(fēng)策略平均得分為基準(zhǔn)分的96%,在此排名第一;在第三次實(shí)驗(yàn)中,阿克塞爾羅德并未增加新的策略,而是從演化博弈的角度出發(fā),試圖發(fā)現(xiàn)史密斯的“演化穩(wěn)定策略”(ESS),模擬結(jié)果表明,跟風(fēng)策略在演化迭代中依舊表現(xiàn)出色,而“詭詐型”策略在200代以后完全消失。通過三次重復(fù)囚徒困境博弈實(shí)驗(yàn),阿克塞爾羅德發(fā)現(xiàn):跟風(fēng)策略穩(wěn)定成功的原因在于它綜合了善良性、報(bào)復(fù)性和寬容性。[30]善良性,即從不首先背叛;報(bào)復(fù)性,也稱可激怒性,即對(duì)方若背叛,則自己將在下輪對(duì)其懲罰;寬容性,即一旦“改過”,自己以合作對(duì)待。正是這三種特性保證了跟風(fēng)策略在與各種策略的博弈過程中能夠獲得較高的平均支付,具有較強(qiáng)的適應(yīng)性,即跟風(fēng)策略具有演化穩(wěn)定性。正如生物學(xué)家道金斯所說,即使有自私的基因掌權(quán)控制,好人仍能得好報(bào)。[31]
欄目分類
熱門排行
推薦信息
- 創(chuàng)造性舞蹈在少兒舞蹈教學(xué)中的實(shí)踐研究
- 藏族民間游戲融入少兒舞蹈作品的實(shí)踐與探索
- 舞臺(tái)美術(shù)設(shè)計(jì)中的空間布局與觀眾體驗(yàn)研究
- 數(shù)字化背景下湖湘文化賦能高校舞蹈教育發(fā)展路徑研究
- 情境教學(xué)在舞蹈線上教學(xué)中的運(yùn)用
- 課程思政視閾下高校舞蹈教學(xué)的創(chuàng)新開展研究
- 高校民族舞教育體系構(gòu)建與教學(xué)實(shí)踐
- AI技術(shù)融入高校體育舞蹈中的現(xiàn)狀和發(fā)展路徑研究
- 老莊哲學(xué)視域下贛南采茶舞蹈中丑角表演探究 ——以舞蹈作品《劉二尋花》為例
- 吉林秧歌與文旅融合的協(xié)同發(fā)展路徑
期刊知識(shí)
- 2025年中科院分區(qū)表已公布!Scientific Reports降至三區(qū)
- 2023JCR影響因子正式公布!
- 國(guó)內(nèi)核心期刊分級(jí)情況概覽及說明!本篇適用人群:需要發(fā)南核、北核、CSCD、科核、AMI、SCD、RCCSE期刊的學(xué)者
- 我用了一個(gè)很復(fù)雜的圖,幫你們解釋下“23版最新北大核心目錄有效期問題”。
- CSSCI官方早就公布了最新南核目錄,有心的人已經(jīng)拿到并且投入使用!附南核目錄新增期刊!
- 北大核心期刊目錄換屆,我們應(yīng)該熟知的10個(gè)知識(shí)點(diǎn)。
- 注意,最新期刊論文格式標(biāo)準(zhǔn)已發(fā)布,論文寫作規(guī)則發(fā)生重大變化!文字版GB/T 7713.2—2022 學(xué)術(shù)論文編寫規(guī)則
- 盤點(diǎn)那些評(píng)職稱超管用的資源,1,3和5已經(jīng)“絕種”了
- 職稱話題| 為什么黨校更認(rèn)可省市級(jí)黨報(bào)?是否有什么說據(jù)?還有哪些機(jī)構(gòu)認(rèn)可黨報(bào)?
- 《農(nóng)業(yè)經(jīng)濟(jì)》論文投稿解析,難度指數(shù)四顆星,附好發(fā)選題!