博弈論導論筆記第一部分

2023-01-24 11:06:06 字數 3189 閱讀 2161

在所有社會中,人們的行為總是會相互影響的(合作、競爭)。

術語「相互依賴性」,表示乙個人的行為對另乙個人的福利造成的影響,不管這種影響是正面的還是負面的。

相互依賴的情形可稱為「策略環境」,因為人們為了確定所採取的最優行動,必須考慮他周圍的其他人會怎麼行動。

博弈論有助於你對這個社會是如何執行的問題做出評估。

非合作博弈論

在「非合作博弈」的框架內,我們可以將策略環境理解為通常字面上博弈(game)的含義。因為名詞博弈意著這樣一種環境,其中兩個及以上的對手進行才智的比拼,因此遊戲中必然存在這樣的依賴性,也就是一方的最優行為取決於他所相信的對方會採取的行動。

非合作博弈論區別於其他研究策略的理論框架的乙個主要特徵是:非合作的框架把所有人的行動都當成是個別行動(individual actions)。 個別行動指的是乙個人進行自主決策,而與這個策略環境中的其他人無關。

這個理論框架並沒有排除以個人限制另乙個人的可能性;也並非與參與人進行群體決策的情況不相容。在群體決策的情況下,非合作理論模型要求理論學者規定如何做出決策的程式。這個程式包括了規定行為人如何就選擇權進行談判,其中可能有討價還價(都視為個別行動)。

事實上,其中的任何乙個人所做出的每乙個決定都可以模型化為個別行為。

合同及合作博弈論

在某些情況下,從所有決策都被看作是個別行動的思路抽離出來——也就是,跳出非合作博弈論模式,根本不將協商過程模型化,而單單將協商的結果看作是乙個聯合行動(joint action),這樣反而對研究更有幫助。 這種理論稱為「合作博弈論」(cooperative game theory)。

這本書將合同視為策略互動整體化的乙個部分,因此,對合同的選擇和執行要特別予以注意。

將聯合行動的概念納入策略模型是乙個簡化裝置,使得你可以刻畫行為人之間就某些事情進行協商,但不用明確的將協商過程本身模型化。行為人如果就聯合行動達成協定,將受其約束而採取相應行動,從這個意義上說,協商的目標可以認為是「可實時締約(spot-contractible)的。

「博弈「的含義

簡而言之,博弈是策略環境的正式描述。因此,博弈論是研究相互依賴情形的正式的方**。

本書的前半部分強調了在策略互動中由理論所確定的三個主要矛盾(tensions):(1)個別利益和集體利益之間的衝突 ,(2)策略不確定性,以及(3)無效率協調的陰影。 制度有助於緩和這些矛盾。

關於博弈的正式表述含有以下共同的要素:

1. 博弈的一組參與人;

2. 對於參與人可能採取行動的乙個完整描述(即它們的可行行動集);

3. 對於參與人採取行動時所知資訊的描述;

4. 對於參與人的行為將如何導致博弈結果的規定;

5. 對於參與人對結果的偏好的定義。

非合作博弈的數學描述有兩種通常的形式:擴充套件型(extensive form)和標準(策略)型[normal (strategic) form]。

我們可以用乙個樹狀結構圖來表示兩個人之間的決策互動,這種樹狀結構由節點和分支組成,節點表示博弈過程中事件的發生點(比如參與人之一做出的決策),而分支表示參與人能夠選擇的不同行為方案。我們用實心圓來表示節點,並用連線節點的箭頭來表示分支。乙個適當構造而成的樹狀結構就稱為「擴充套件型表述(extensive-form representation)。

圖2.4描述了博弈中所有參與人的行動及資訊。節點a、b、c、d和e都稱為決策點(decision nodes),因為參與人在博弈的這些節點上做出決策。

其他節點(f , g , h , l , m和n)稱為終止點(terminal nodes); 它們表示為博弈的結果——博弈結束的地方。每乙個終止點也同時對應於一條唯一的沿著決策樹的路徑,這是一條從初始點出發,沿著箭頭的方向由各分支連線,貫穿整個決策樹的決策路徑。 在擴充套件型中,路徑和終止點之間有一一對應的關係。

一般來說,我們用資訊集來定義各參與人在博弈中的決策節點所擁有的資訊。 乙個資訊集描述的是那些用虛線互相連線的決策節點(意思參與人無法區分這些節點)。 每乙個決策點包含在某個資訊集裡,乙個資訊集可包含乙個or多個決策節點,如:

節點a的資訊集就只包含乙個節點,c和d 則包含在同乙個資訊集裡。乙個博弈中的每個資訊集明確的描述了各參與人必須做出的不同決策。

通常用數字來表述參與人的偏好排序時最簡便的,這也稱為得益(payoffs)或效用(utilities)。越大的回報數字意味著更為偏好的結果。

在某些博弈中,乙個參與人可能從無限多的行動中進行選擇。

定義:策略(strategy) 是博弈中參與人的一組完整的相機的行動計畫。

「完整的相機的計畫」是對乙個參與人行為的完整描述,它包含了這乙個參與人在它的每乙個決策點上所做出的行為,即策略描述的是在它的每個資訊集中它所做出的行動。

我們用來表示參與人i 的策略空間(strategy space),也稱為策略集合(strategy set)。也就是說,是包含了改博弈的參與人i的每乙個可能策略的集合。我們用小寫字母來表示單個策略(即這些集合中的一般元素),則∈是博弈中參與人i的乙個策略。

乙個策略組合(strategy profile)是關於策略的向量,每一項表示乙個參與人。換句話說,乙個策略組合描述了博弈中所有參與人的策略。舉個例子,假設我們在研究乙個有n個參與人的博弈。

那麼乙個典型的策略組合就是這樣乙個向量,s其中是參與人i的策略,i=1,2,···,n。s表示策略組合的集合。在數學上表示為s =╳╳···╳。

(符號╳表示笛卡爾乘積。比如=, =,那麼s =╳= 。)

對於某個參與人i,我們經常要說到博弈中其他所有參與人所選擇的策略。就符號而言,用 –i來指代除了參與人i之外的所有其他參與人會比較方便。因此, 是關於除參與人i之外的所有參與人的策略集合:

將乙個策略組合s分為參與人i的策略和其他參與人的策略,我們可以寫為s = (, )。

對於每個參與人i,我們可以定義乙個函式:s→r(這個函式的定義域是策略組合的集合,它的值域是實數),因此,對於各參與人所選擇的每個策略集合s∈s,(s)是參與人i在博弈中的得益。這個函式稱為參與人i的得益函式(payoff function)。

策略和得益可以作為乙個博弈的基本表述,其正式定義如下:用標準型(normal form)表示的博弈(也可稱之為策略型(strategy form))包含一組參與人,,各參與人的策略空間,,···,,以及各參與人的得益函式,,···,。

具有有限策略空間的博弈型兩方博弈可以用得益矩陣來表示。因此,這種博弈有時又稱為「矩陣博弈」。

標準博弈的經典例子

對標準型的解釋

看圖4.3中包含的標準型和擴充套件型可以發現,由兩個擴充套件型得到的標準型是相同的(對此你可以進行核實)。這就證明,雖然把擴充套件型變為標準型只有唯一的一條路徑,但反過來則不盡然。

作業 第一部分

第一部分投影基本知識 一 單選題 1 已知m點在n點正前方,則m和n兩點的 b 座標值不相等。a x方向 b y方向 c z方向 d 所有方向 2 已知點m座標 10,20,10 點n座標 10,20,0 則以下描述m n兩點相對位置關係的說法哪一種是正確的?a 點m位於點n正下方b 點m位於點n正...

第一部分概述

第一章良好農業規範 gap 的發展概況 第一節良好農業規範 gap 產生的背景和概念 一 良好農業規範產生的背景 近三 四十年,農業繁榮得益於化肥 農藥 良種 拖拉機等增產要素的產生,而隨著整個農業生產水平的提高和各種農業生產要素的日益成熟,這些要素對增產的貢獻率趨減。由於農業生產經營不當導致的生態...

第一部分專案策劃

專案管理手冊 電力工程事業部 2012年8月 目錄第一章專案定位 1 1.1 專案投標階段 1 1.2 專案中標後 1 1.3 專案定位的方法 1 1.4 專案定位與調整 2 第二章專案組織機構 3 2.1專案部組織機構 3 2.2 專案部組織機構圖 5 第三章專案經理崗位職責 6 3.1 崗位目的...