演化博弈的分析范式與占優(yōu)的跟風(fēng)策略——河北經(jīng)貿(mào)大學(xué)學(xué)報(bào)

作者：陳博來源：原創(chuàng)日期：2013-09-14人氣：1010

演化博弈理論是研究群體進(jìn)化的一種動(dòng)態(tài)方法，其研究對(duì)象是頻率制約選擇下的進(jìn)化動(dòng)態(tài)。其中，個(gè)體的適應(yīng)度并非常數(shù)，而是依賴于不同表現(xiàn)型在群體中所占的比例。演化博弈理論源于博弈論與生物學(xué)之間的互動(dòng)：首先，生物學(xué)家嘗試運(yùn)用博弈論建構(gòu)各種生物競(jìng)爭(zhēng)演化模型，比如生存競(jìng)爭(zhēng)、性別比例等；[23]然后，生物學(xué)家將種群思想引入博弈論之中，比如適應(yīng)度概念、進(jìn)化穩(wěn)定策略、復(fù)制方程等；[24]最后，經(jīng)濟(jì)學(xué)家借鑒生物學(xué)家提出的理論，繼續(xù)發(fā)展了演化博弈，從演化穩(wěn)定均衡擴(kuò)展到隨機(jī)穩(wěn)定均衡。不論演化博弈理論如何發(fā)展，獨(dú)特的分析范式是其核心特征。
（一）演化博弈的分析范式
2. 演化穩(wěn)定策略。演化穩(wěn)定策略（ESS，Evolutionarily Stable Strategy）是演化博弈中一個(gè)非常關(guān)鍵的概念。[25]其核心思想是，如果一個(gè)現(xiàn)存策略是演化穩(wěn)定策略，那么，必須存在一個(gè)正的進(jìn)入障礙，使得當(dāng)變異策略的頻率低于這個(gè)障礙時(shí)，現(xiàn)存的策略能夠比變異策略獲得更高的收益[26]。假設(shè)現(xiàn)存策略為x，變異策略為y，而變異者進(jìn)入后占總體的比例為？著（0<？著<1）。在這個(gè)雙態(tài)總體中，現(xiàn)存策略進(jìn)入后的支付為u（x，？棕），變異策略進(jìn)入后的支付為u（y，？棕）。若u[x，？著y+（1-？著）x]>u[y，？著y+（1-？著）x]，則現(xiàn)存策略x被稱為演化穩(wěn)定策略。[27]因此，演化方法關(guān)注的是單個(gè)大總體中的對(duì)稱配對(duì)博弈，即側(cè)重兩個(gè)策略之間互動(dòng)關(guān)系，而不涉及兩個(gè)以上的多態(tài)個(gè)體間的博弈。此外，演化穩(wěn)定性并未解釋策略的來源，只是檢驗(yàn)策略一旦出現(xiàn)，在演化壓力下是不是穩(wěn)定。所以，從本質(zhì)上來看，演化穩(wěn)定性是每次只針對(duì)一個(gè)變異的穩(wěn)定性檢驗(yàn)，強(qiáng)調(diào)的是變異的作用。
3. 復(fù)制動(dòng)態(tài)方程。演化過程是兩個(gè)基本要素的組合：一個(gè)是產(chǎn)生多樣性的變異機(jī)制；一個(gè)是傾向一些種類的選擇機(jī)制。演化穩(wěn)定性強(qiáng)調(diào)變異的作用，即個(gè)體策略的隨機(jī)變動(dòng)，而復(fù)制動(dòng)態(tài)強(qiáng)調(diào)的則是選擇的作用。（二）占優(yōu)的跟風(fēng)策略
一種人類行為如果經(jīng)歷了漫長(zhǎng)的演化過程，即經(jīng)過變異的入侵檢驗(yàn)和選擇的動(dòng)態(tài)復(fù)制，能夠生存下來。那么，就可以說這種人類行為是演化穩(wěn)定的。通過前面的分析可知，要想揭示強(qiáng)互惠行為的內(nèi)生性和生物理性本質(zhì)，必須從演化的視角進(jìn)行解讀。那么，在演化博弈中應(yīng)該如何來解釋強(qiáng)互惠行為呢？對(duì)這一問題的回答可以從演化博弈中的關(guān)鍵性概念“跟風(fēng)策略”開始。
跟風(fēng)策略（TFF，Tit for Tat）又稱“一報(bào)還一報(bào)”策略，即開始時(shí)選擇合作，然后不斷重復(fù)對(duì)方上一步的選擇。[29]它是由多倫多大學(xué)博弈論專家阿納托爾·拉帕波特（Anatol Rapoport）在羅伯特·阿克塞爾羅德（Robert Axelrod）重復(fù)囚徒困境計(jì)算機(jī)競(jìng)賽中提出的一個(gè)博弈策略。阿克塞爾羅德在20世紀(jì)末進(jìn)行了三次計(jì)算機(jī)模擬實(shí)驗(yàn)，目的在于探討人類合作能否從有著自己利益最大化推理邏輯的行動(dòng)者的行為互動(dòng)中自發(fā)產(chǎn)生。在第一次實(shí)驗(yàn)中，共有15種策略參賽、225場(chǎng)比賽，模擬結(jié)果顯示，跟風(fēng)策略平均得分504.5，即基準(zhǔn)分600的84%，排名第一；在第二次實(shí)驗(yàn)中，阿克塞爾羅德將參賽策略增加到63個(gè)，并將第一次實(shí)驗(yàn)的結(jié)果告知參賽者，模擬結(jié)果顯示，跟風(fēng)策略平均得分為基準(zhǔn)分的96%，在此排名第一；在第三次實(shí)驗(yàn)中，阿克塞爾羅德并未增加新的策略，而是從演化博弈的角度出發(fā)，試圖發(fā)現(xiàn)史密斯的“演化穩(wěn)定策略”（ESS），模擬結(jié)果表明，跟風(fēng)策略在演化迭代中依舊表現(xiàn)出色，而“詭詐型”策略在200代以后完全消失。通過三次重復(fù)囚徒困境博弈實(shí)驗(yàn)，阿克塞爾羅德發(fā)現(xiàn)：跟風(fēng)策略穩(wěn)定成功的原因在于它綜合了善良性、報(bào)復(fù)性和寬容性。[30]善良性，即從不首先背叛；報(bào)復(fù)性，也稱可激怒性，即對(duì)方若背叛，則自己將在下輪對(duì)其懲罰；寬容性，即一旦“改過”，自己以合作對(duì)待。正是這三種特性保證了跟風(fēng)策略在與各種策略的博弈過程中能夠獲得較高的平均支付，具有較強(qiáng)的適應(yīng)性，即跟風(fēng)策略具有演化穩(wěn)定性。正如生物學(xué)家道金斯所說，即使有自私的基因掌權(quán)控制，好人仍能得好報(bào)。[31]

關(guān)鍵字：論文篇教育篇發(fā)表論文

上一篇：強(qiáng)互惠行為的生物理性本質(zhì)：行為博弈與演化博弈的比較研究——河北經(jīng)貿(mào)大學(xué)學(xué)報(bào)
下一篇：行為博弈與演化博弈的比較——河北經(jīng)貿(mào)大學(xué)學(xué)報(bào)

欄目分類

熱門排行

推薦信息

期刊知識(shí)