同濟大學馬洪寬老師博弈論複習

2022-09-08 03:36:07 字數 4469 閱讀 1681

博弈是一些個體,面對一定的環境,在一定的規章制度下,同時或先後,一次或多次在其允許的策略集中選擇其行為並加以實施,最終獲得一定結果的過程

博弈論從衡量利弊得失的角度出發,分析形勢得出相應的對策,在決策的過程中考慮到參與的其他人的行為會相互影響的決策者,需要博弈論,決策中不考慮他人的行為的決策者不需要博弈論。

博弈論通常記為g或γ,局中人的集合通常為n,為局中人n,局中人的策略集記為s,則某一策略記為αi,局中人i的策略組合為(αi,α-i),其中α-i表示局中人i以外所有人的策略組合。局中人的收益u是α的函式,則博弈也記為g(n,s,u),若考慮資訊則是g(n,s,u,i)

上策均衡:每個人都有上策,博弈時必取上策,形成的均衡為上策均衡。

囚徒困境:對每一行在第二個分量中劃線,即甲策略不變時乙的策略。反之亦然

兩人都有上策均衡,亦為納什均衡

智豬博弈:有一開關,大豬小豬都按,則大豬得7單位,小豬得3單位;大豬按,小豬不按,大豬得6單位,小豬得4單位;小豬按,大豬不按,大豬得9單位,小豬得1單位;但是按一下會消耗2單位(此處隱含條件,兩者都不按則無收益與支出)。

此時小豬有上策[不按],但是大豬無上策——小豬選擇不同,大豬選擇也相應不同。此時(大豬,小豬)的納什均衡為(按,不按)

此情境可推廣至投資機構與**的投資行為。機構研究市場動向,之後**跟風。

娛樂博弈:甲愛象棋,乙愛圍棋,甲乙一起下象棋,甲得5,乙得2;甲乙一起下圍棋,甲得2,乙得5;但是兩人選擇不同則遊戲無法開始。

兩人均無上策,(甲,乙)的納什均衡為(象,象)或(圍,圍)

便士博弈:甲乙同時放一枚硬幣,如同面則乙給甲1塊錢,如異面則甲給乙1塊錢

此題不存在純策略靜態博弈的納什均衡,但有混策略均衡。混策略的原則是做出某種概率,使對方的收益無差異。

設甲取正概率為p,可寫出乙的期望收益,欲使乙無差異,則p=0.5;同樣,對乙的選擇亦如此。

定理:任意有限博弈必定存在一納什均衡。

古諾模型(產量決策模型):甲乙兩廠商生產一產品,**函式為p=8-q,單位成本c=2,問甲乙應如何定產量?

解:設甲產q1,乙產q2,則q=q1+q2

π1=pq1-cq1=(8-q1-q2) q1-2 q1=-q12+(6-q2)q1

同理可得:

令兩偏導數均為零,解得q1=q2=2

則π1=π2=4

卡特爾:甲乙約定「各產一半,利潤均分」

π=(8-q)q-2q,求導得q=3時π最大,即各產1.5,各得4.5

但根據π1=-q12+(6-q2)q1可算出在q2=1.5時甲利潤最大的產量並不是1.5,而是2.25,此時甲可得利潤5.0625,因此合作不牢固

下策:無論對方如何行動,甲在α和β兩個策略中都有α優於β,則稱β為下策;與上策不同,上策是優於所有其他策略的策略,而下策是只要劣於任意乙個其他策略的策略

博弈樹:描述動態博弈的工具,注意兩個節點是否因資訊未知而實際為乙個

借錢還錢博弈:甲向乙借錢,乙可以選擇借或不借,如果不借則兩者均無收益支出,選擇借,則甲可以選擇還或者不還,選擇還則甲乙收益均為1,選擇不還則乙可選擇訴訟還是不訴訟,訴訟收益為甲1.5,乙0.

5,不訴訟則甲4,乙-2。

畫博弈樹,利用遞推歸納法

斯塔克伯格模型:

p=8-q,單位成本c=2,甲先確定其產量,之後已確定其產量,問兩者產量各多少。

先看第二階段,乙的利潤函式π2=6q2-q1q2-q22,對q2求偏導,可得q2=(6-q1)/2,之後將此式代入π1,得π1=3q1-q12/2,求導得q1=3,q2=1.5

工資的確定:

第一階段,工會定工資,收益u(w,l),w為工資,l為被僱傭人數。

第二階段,企業僱傭人,利潤π=r(l)-wl,r為l個人生產的產值。

解:先分析第二階段,企業僱傭人數為π對l的偏導,求出l,繼而進入第一階段,將l代入u(w,l),求u對w的偏導,即可求出w。

這種方法現實中並非雙方默契,而需要雙方談判達成。

折現率:明年100元在今年值a元,則折現率δ=a/100。注意:老師上課將δ稱為貼現率,這是錯誤的。

討價還價博弈:

甲乙分錢,甲先提出一種分法,乙可以選擇同意或拒絕,如拒絕則乙提一種分法,甲同意或拒絕,如拒絕則甲提一種分法,乙必須同意。

如果規則僅僅如此,則結果必然是甲全拿,乙無收穫,即(1,0)。理由如下:如果博弈可以進入第三階段,則甲必然將錢全部據為既有,則在第二階段無論乙如何劃分,甲都必須拒絕,則在第一階段甲亦會做出甲得1,乙得0的劃分,第一階段乙無論同意或拒絕都改變不了最終結果。

規則修改:每一階段的折現率為δ (0<δ<1),即假設博弈進入第二階段,則總錢數將不為1而是δ。

解:博弈樹如下:

之所以將第二階段與第三階段的分錢方案寫為δq2與δ2q3,是因為這樣會簡化計算,無實質性差異。

第三階段的分法是(δ2q3,δ2(1-q3)),而如果在第二階段有δq2>=δ2q3,則在第二階段甲會選擇同意而不會進入第三階段(注意,如果甲此時選擇進入下一階段則甲收益不少,但乙收益會減少,而我們假設每個理性人只考慮自己利益最大化,而不理會其他人利益,故在保證自己利益的情況下不會去損害他人,當然零和博弈保護自己即是損害他人,如每一階段獨立來看都是廣義零和博弈)。同樣,如果在第一階段有1-q1>=δ(1-q2),則乙會直接同意而不進入第二階段。取臨界等式,可得q1=1-δ+δ2q3。

即如果在第三階段有一分法(δ2q3,δ2(1-q3)),則相應的在第一階段必定有雙方同意分法(1-δ+δ2q3,δ-δ2q3)。顯然,在第三階段甲會獨吞剩餘錢數,即q3=1,甲得到δ2,則第一階段的分法將會是(1-δ+δ2,δ-δ2),即如果折現率為1或0,則甲都會獨吞,但折現率在0和1之間,甲不會獨吞。甲乙永遠不會相等,差距最小時為δ=0.

5,說明該規則先下手為強。

規則改變2:假設可進行無限多次討價還價,即如有一方不同意,則永遠按上述規則討論下去,直到雙方同意為止,同樣現值也會以每回合δ的比率折減。

博弈樹如圖

無法使用遞推歸納,因不存在最後乙個階段。

可將決策樹砍掉前兩個階段並與原決策樹進行比較,由於有無限多過程,則兩決策樹等同,即第三階段與第一階段沒有任何差別,是全等的,因此在第三階段可以達到的協議在第一階段就也可以達成。這樣就可以將無限階段動態博弈改為三階段動態博弈。

如上題結論,如果在第三階段甲可以得到1-δ+δ2q,則第一階段甲必定可以得到q,由於第一和第三階段完全等同,則q=1-δ+δ2q,解得q=1/(1+δ),即第一階段分法為(1/(1+δ),δ/(1+δ))。此時結論便不相同,如果δ為1,即不發生現值折減,則兩人會平分;如果δ為0,則甲獨吞——因即使乙不同意乙也什麼都得不到,這可以解釋現實情況,因現實中多為終點不確定的博弈——可等同於無限次博弈。

關稅與國際市場模型:太複雜,略過

銀行擠兌模型:銀行有一200萬元專案,一年後本利和220萬,甲乙各有100萬,如甲乙都將100萬存入,一年後可得110萬,如中途有人提前取款,銀行只得賣掉專案得160萬,先到者得100萬,後到者60萬,如兩人同時提前取,各得80萬。分析:

第一階段,甲乙是否存款;第二階段,甲乙提前還是到期取款。

解:先分析第二階段,見下表:

則有兩個納什均衡(提前,提前)和(到期,到期),再分析第一階段

綜合來看,在(存,存)策略中會有兩種可能的收益情況:

但此時雙方都會預見到只要自己不主動提前支取,另一方不會提前支取的,同時自己沒必要提前支取,因到期支取獲得的收益要大,因此博弈的穩定結果為(存,存)以及(到期,到期)

重複博弈:一次博弈,策略集中有p個元素,則重複t次,策略集中有pt個元素。

連鎖店悖論:甲在某地先開連鎖店,之後乙也想在此地開連鎖店,甲的策略集(默許,鬥爭),乙的策略集(進入,不進入)

納什均衡應當為(默許,進入)

修改規則:將此博弈重複20次(可理解為有20個地區遇到相同情況),問結果如何?

完美資訊動態博弈,最後一階段必取均衡。假設有n個階段(n有限),在第n階段時前n-1個階段的收益已定,在第n階段收益多少決定了總博弈收益多少。同理,n-1也必取均衡……因此所有階段都要取均衡。

這樣甲乙的收益為(2000,1600)。

但這樣分析可能與現實產生矛盾。甲可以在前5回合都選鬥爭,之後乙虧損嚴重退出競爭,之後15回合乙都不進入,此時甲收益1500>1000。

說明不能簡單認為每回合都取均衡,可以設計策略。

定價博弈:甲乙對乙個商品進行定價,支付矩陣如下表

在一次博弈中均衡為(中,中)或(低,低),但在重複博弈中可設計策略。

現將此博弈重複兩次,策略可如此設計:第一階段甲取高,如乙也取高,則第二階段甲取中;如第一階段乙取中,則第二階段甲取低。此策略對乙也是相同。

如果乙選擇合作,則收益為5+3=8,如乙不合作,則收益至多為6+1=7,則乙會選擇合作。對甲亦如此

最後一階段必然需要取均衡,因最後一階段沒有約束手段,不可能達成合作。

一次性博弈中如局中人收益和最大者對應的策略組合未實現,則在重複博弈中產生合作的可能,即產生新的均衡(提高社會總收益)的可能。

產生的方法:先試圖合作,如對方合作則繼續合作;如對方不合作,則從此一直不合作,稱為觸發策略。觸發策略產生了重複博弈的一均衡。

市場選擇

甲乙各有a、b連個投資機會,如兩人均a,各得3;一a一b,選a得1,選b得4;如兩人均b,各得0。問重複2、3、4次會如何?

Ektgec俞敏洪同濟大學演講

生活需要遊戲,但不能遊戲人生 生活需要歌舞,但不需醉生夢死 生活需要藝術,但不能投機取巧 生活需要勇氣,但不能魯莽蠻幹 生活需要重複,但不能重蹈覆轍。無名同濟大學的同學們大家晚上好!其實人活著就挺好,至於生命有沒有意義另當別論。活著每天都會有太陽公升起來,每天都會看到太陽落下去。你就可以看到朝霞,看...

afuxdbx俞 敏洪 同濟大學演講

乙個人總要走陌生的路,看陌生的風景,聽陌生的歌,然後在某個不經意的瞬間,你會發現,原本費盡心機想要忘記的事情真的就這麼忘記了.同濟大學的同學們大家晚上好!其實人活著就挺好,至於生命有沒有意義另當別論。活著每天都會有太陽公升起來,每天都會看到太陽落下去。你就可以看到朝霞,看到晚霞,看到月亮公升起和落下...

同濟大學複試經驗

我09,10年考了兩次,對土木學院初試複試情況還算比較了解,這個論壇讀研後也經常來逛,一是很懷念努力準備考研那段時間,二是看看大家有什麼問題我幫忙解答。我是結構的,其他專業情況也了解一點。1 關於分數線和導師 10年複試之前出分之後曾經有位兄弟在論壇上發了乙份結構工程的初試成績排名,有學校和單科成績...