基於博弈論的制度有效性分析

摘要：制度可看作由管理者和被管理者參與的博弈規則，規則不同博弈參與者的策略選擇依據就不同，導致的收益和成本也就不同，最終決定了制度是否被遵守。通過構建兩階段動態博弈模型，並用逆向歸納法來對該動態博弈分析可得出制度遵守的均衡解，繼而得到提高制度有效性的建議。

關鍵字：制度有效性違規博弈

有乙個典型的案例：甲乙兩人合夥作案，結果被警察抓了起來，分別被隔離審訊。在不能互通訊息的情形下———也就是不知道對方是坦白還是緘默的前提下，每個嫌疑犯都可以作出自己的選擇：

或者供出同夥，即與警察合作，從而背叛同夥；或者保持沉默，也就是與同夥合作，而不是與警察合作。這樣會出現以下幾種情況：如果兩人都不坦白，警察會因證據不足而將兩人各判刑!

年；如果一人招供而另外一人不招，坦白者作為證人將不會被起訴，另一人將會被重判!" 年；如果兩人都招供，則會因罪名成立各判!# 年。

這兩個嫌疑犯該怎麼辦呢？是選擇合作還是互相背叛？從表面上看，他們應該互相合作，保持沉默，因為這樣對他們整體而言是最好的結果———都只判!

年。但是他們不得不仔細考慮對方可能採取的選擇。問題就這樣開始了，兩個人都十分精明，而且只關心減少自己的刑期，並不會在乎對方被判多少年。

每個人都會這樣推理：假如對方不招，我只要一招供，馬上可以獲得自由，而不招卻要坐牢! 年，顯然招比不招好；假如對方招了，我若不招，則要坐牢!

" 年。招了只要坐牢!# 年，顯然還是招更好些。

可見，對方無論招或者不招，我的最佳選擇都是招認。兩個人都會基於同樣的想法作出招供的選擇，這對他們個人來說都是最佳策略，但對整體而言卻是乙個最差的結果。這就是博弈論的乙個經典模型———「囚徒困境模型」。

在管理中，制度是管理活動的基本依據和規程，對被管理者的行為起著約束作用，制度是否有效對於管理活動的成敗有著重要的意義。制度有效性指的是制度的實施效率，即制度被主體認同、遵循的程度。就目前來看，由於缺乏對制度設計的理論與方法的深入**，很多制度存在缺陷，不合理的制度設計導致了在制度執行過程中出現大量違規行為，有的制度存在事實上的虛置，制度如何能被遵循已經成為當前乙個亟待研究的問題。

因此本文對制度的實施效率展開研究。博弈論作為一種分析工具，主要研究在利益相互影響的局勢中，局中人如何選擇自己的策略才能使自身的收益最大化時的均衡問題。將其用在制度的有效性分析中，有利於找出違規行為發生的原因，從而得到制度設計的啟示和建議。

一、制度中的人性假設

任何制度的設計都是建立在對人的行為的假設的基礎上的，每乙個制度研究者，都必須首先研究人性。人性如何定位，是進行制度設計的前提。

長期以來，我國很多制度都是建立在道德人假設的前提下。在假定人是道德人的前提下，對制度的要求是很低的，更大的是對人的品德的期待，主要靠的是人的自律。但是現實中所發生的諸如**腐敗、企業偷稅漏稅、製假售假等大量不良行為使我們不得不看到寄希望於人的品德對人的行為的約束，是不現實的。

對於制度設計者來說，制度設計就是要為人性設定一條防範的底線，即當人們想幹壞事的時候，因為有制度底線的防範而不能得逞，因此在設計制度時應全面考慮人可能的行為，尤其是人可能的壞的行為。託克維爾在總結美國的民情時就說過，美國的民情之一就是對**的不信任，因為他們最接近權力，也更有可能是無賴。事實上，英美國家的人性預設是「人是無賴」，就是說一有機會他便會佔便宜，一有權力，他便有可能腐敗。

基於以上假設在管理活動中，由於被管理者是理性的追求效用最大化的人，所以會利用各種條件和機會使自己的效用最大化，甚至不惜損人利己，當被管理者發現違反制度將得到比遵守制度更多的收益時，往往就會選擇違反制度。

二、博弈視角下的制度有效性分析

作為一種關於決策和策略的理論，博弈論其實就在我們身邊，它研究的許多例子來自於日常生活和經濟活動中的遊戲和事物。博弈的英文即，中文譯為「博弈」是非常傳神和貼切的，因為中國古代稱下棋為「弈」，「博」則含有爭鬥的意思。在下棋這樣的遊戲中有乙個重要的特點：

即策略在其中起著舉足輕重的影響和作用。精明慎重的棋手們相互揣摩、相互牽制，人人爭贏，布每乙個棋子時，都必須考慮到對手的策略選擇，從而選擇自己的最佳策略。這也就是博弈的核心問題：

決策主體的一方行動後，參與博弈的其他人將會採取什麼行動？參與人為取得最佳效果應採取怎樣的對策？我們可以將博弈論定義為：

一些個人、一些團隊或其他組織，面對一定的環境條件，在一定的規則約束下，依靠所掌握的資訊，同時或先後，一次或多次，從各自允許選擇的行為或策略進行選擇並加以實施，並從中各自取得相應結果或收益的過程。

作為博弈參與者進行博弈的規則，制度能夠通過對博弈參與者的違規行為施加懲罰和成本的方式達到對其行為進行規範和約束的目的，制度約束不同，博弈參與者的策略選擇依據就不同，導致的收益和成本也就不同，最終決定了制度是否被遵守。所以制度是否有效，很大程度上取決於制度設計。在某種意義上，正是由於我們現行的某些制度尚存在著種種缺陷，才導致了被管理者違規行為的層出不窮。

本文將通過構建博弈模型來詳細分析違規行為發生的原因。

乙個完整的博弈關係至少應包括三個要素，即局中人、策略與支付。博弈活動可以按照不同的特點劃分成不同的型別。其中，按局中人之間能否達成有約束力的協議分為合作博弈和非合作博弈。

按博弈的時間或行動次序，可以分為靜態博弈和動態博弈，按照局中人擁有的資訊結構可分為完全資訊博弈和非完全資訊博弈。在以管理制度為博弈規則的博弈中，局中人分別為管理者與被管理者。由前面的人性假設可知，在管理活動中，管理者和被管理者將遵循個人行為理性的原則，在既定的博弈規則——制度下，雙方都把個人效用最大化作為自己行為和策略選擇的出發點，因此以管理制度為規則的博弈主要是指非合作博弈。

為了分析方便，我們假設被管理者在制度實施過程中有「遵守制度」和「違反制度」兩種策略選擇，管理者也有「查處」和「不查處」兩種策略選擇雙方在行為前對對方的策略選擇、行為資訊和收益結果等都有清楚的了解，屬於完全資訊動態博弈。假設被管理者遵守制度的收益為 b ；違反制度的收益為 bw>(bw>bz)；違反制度的成本為co，主要指違反制度受到的懲罰，包括經濟和名譽的損失。

在管理者採取「查處」策略的情況下，被管理者的違規行為被查處成功的概率為p。

當被管理者遵守制度時，管理者得到的收益為 mz；當被管理者違反制度時，管理者在管理活動中的收益為 mw(mw　　管理者在查處違規行為的過程中所花費的各種成本計為 (主要表現為花費在查處方面的人力、物力和財力等)。

如果不查處違規行為，對管理者造成的潛在損失為 (主要表現為制度威信的下降從而造成日後其他被管理者可能違規行為所帶來的損失)。

上述的博弈模型是乙個兩階段完美資訊博弈。用逆向歸納法來對該動態博弈分析求解：針對被管理者在第一階段「違反」的策略，在第二階段管理者有兩種策略選擇：

查處與不查處。其選擇的依據就是衡量在「查處」和「不查處」情況下的收益情況，也就是比較 mw—c 與 mw—c：的大小。

此時，若 mw—c >mw—cz，即 c c：則此時管理者最佳策略選擇是「不查處」。當mw—c-<．mw—cz，即管理者選擇「不查處」策略時，則被管理者在第一階段會選擇「違反」策略。

因為明顯地，bw>bz並且被管理者知道，如果自己選擇「違反」策略，在第二階段管理者會選擇「不查處」。這時均衡結果為：違反，不查處。

此時，制度不被遵守，是無效的。

當mw—c。>mw—c：，即管理者選擇「查處策略時，此時被管理者的策略選擇就要取決於bz與 bw—co x p二者大小的比較了。

如果 bw—co x p>b ，則被管理者在第一階段仍會選擇「違反」策略。這時均衡結果為：違反，查處。

在這種均衡狀態下，每個參與人都相信，在給定其他參與人戰略決定的情況下，他選擇了最優戰略以回應對手的策略，這種出於各自理性考慮所進行的策略選擇最終使制度雙方陷人了類似「囚徒困境的狀態，造成資源和財富的浪費。如果 bw—co xp<13z則在第一階段被管理者會選擇「遵守」策略，其均衡結果是被管理者在第一階段選擇遵守制度結束博弈。這個均衡結果正是我們想要的也即制度被遵循，是有效的。

三、對制度設計的啟示

上述博弈模型及求解過程為制度設計提供了許多有益啟示。筆者認為，在制度設計時，可採取以下方法來提高制度的有效性：

(一)增大違規行為的成本。通過以上對違規行為的分析，不難發現，被管理者違反制度的主要原因，在於其違反制度所獲得的收益大於其遵守制度所獲得的收益，因此可通過增加違規行為成本的方式來限制違規行為的發生，即加大懲罰強度，一般來說，懲罰強度越大，被管理者越傾向於遵守制度。另外，基於制度中人的行為假設，被管理者不僅有追求物質利益的傾向也有追求榮譽、情感等的傾向，所以在設定獎懲時內容不能過於單一，例如不要僅用金錢物質作為獎懲手段。

並且對於不同的人群來說，獎懲的內容也不應相同。

(二)提高違規行為的查處概率。從以上模型可看出，提高查處概率，可降低的值，而要提高違規行為的查處成功的概率，可採取多種措施，例如加大查處力度，舉報，增強對違規行為的偵破能力等。其中通過構建行為測度來提高違規行為的可觀測性是提高查處成功概率的有效手段之一。

違規行為的可觀測性越好，則查處成功概率就越高。如果處於制度中的人的行為是不可觀測的，那麼就會加大查處難度，降低查處成功的概率。為了提高某種行為的可觀測性，在制度設計時可以為這個行為構造一種測度。

例如，在工廠的考勤制度中，「上班遲到」是違規行為，但是在工人很多的情況下，「遲到」往往成為乙個難以觀察的行為，即使安排專人負責記錄每人的上班時間，也往往有人在月底「不認帳」，造成「講不清」的現象。由於不能成功查實「遲到」行為，就不能對之進行懲處。為此，管理者採取「早上進廠時由工人自己在掛牌箱掛牌，過時間鎖掛牌箱」的辦法，這樣就使每天遲到者無法把自己的牌子掛上，從而使「上班遲到」行為的可觀測性大為提高。

在現實中，這種管理者為改善被管理者行為的可觀測性而構造的「測度」是很常見的。又如，在商店中實行「開票付款」，就是為了觀測售貨員在賣貨收款時是否有私吞錢款的行為。

(三)通過多次博弈使制度不斷完善。從上述分析可知，通過調整博弈規則可使博弈雙方的博弈結果達到有效均衡，因此我們可以把制度不斷完善的過程理解為制度雙方多次博弈並不斷調整博弈規則使博弈達到有效均衡的過程。制度完善的過程也是制度逐漸接近「納什均衡」的過程。

「納什均衡」是制度的理想狀態，即：給定別人遵守制度的情況下，沒有人有積極性偏離制度規定的自己的行為規則。換句話說，如果乙個制度不構成納什均衡，它就不可能自動實施，因為至少有乙個參與人會違背這個制度。

任何制度都不是一次性完善的，特別是在市場經濟不斷發展，新的事物不斷湧現的現實生活中，想要一勞永逸地制定達到「納什均衡」狀態的制度是不可能的，需經過反覆博弈，不斷調整制度，使之向納什均衡逐漸逼近，博弈的次數越多，完善的程度越高。

基於博弈論的制度有效性分析

市場秩序的博弈論分析

基於博弈論的營銷渠道橫向衝突研究及其對策分析

基於博弈論的高新技術產業人力資源管理分析

基於博弈論的制度有效性分析

市場秩序的博弈論分析

基於博弈論的營銷渠道橫向衝突研究及其對策分析

基於博弈論的高新技術產業人力資源管理分析

相關推薦