期末師生互評制度的博弈分析

摘要：又是一年期末，師生之間的互評開始，學生作為教學的接受者，有權對教師教學的質量進行評定，當然，教師也有資格對學生學習水平和學習能力進行評定，師生之間的互評成為保證教學質量的最重要也是最原始的制度。然而這一制度卻正隨著時間的推移變得僵化，其作用發揮不盡人意，甚至逐漸喪失作用的地步，至少筆者本人歷次評教幾乎都是敷衍而過，而老師每次評學的分數又讓「幾家歡樂幾家憂」。

不難看出，學生評教與教師評學儼然已構成了師生間的博弈關係，本文就從完全靜態資訊和不完全動態資訊博弈的角度對評教評學進行博弈分析，並在此基礎上對解決該困境提出來自己的解決辦法。

關鍵詞：評教評學靜態資訊博弈動態資訊博弈解決辦法

1.引言：「博弈」一詞**於棋弈、橋牌及戰爭中所使用的術語，本意是研究遊戲中各自所選策略的科學。

現代博弈論的含義更為廣泛，成為一門相互作用的的決策主體進行決策和這種決策的均衡問題的理論。

博弈論是由匈牙利數學天才約翰·馮·紐曼(john von neumann)(1903—1957) 博弈論和摩根斯坦在2023年出版的《經濟行為和對策論》一書中提出，並構建了博弈論的理論框架，用來分析兩個或兩個以上的比賽者或參與者選擇能夠共同影響每乙個參加者的行為或戰略的決策方式。1950-2023年間美國數學家和統計學家納什連續發表多篇博弈論的文章，提出了著名的「納什均衡」，奠定了現代博弈論的理論基礎。20世紀80年代博弈論得到廣泛的運用，成為應用經濟學的乙個分支。

本文研究的是在評教和評學過程中，師生之間的博弈問題。最開始中國學生是沒有評教的權利的，評教成了學生們多年的呼聲，教師處在博弈的主動和優勢一方，或者說二者根本就沒有博弈的可能。但是自從學生也有評教的權利後，教師們的每學年評價也會加入學生評教因素，教師們不能像原先那樣對學生的考試成績、學習動機、學習品德、課堂參與、自主學習、能力培養等素質狀況進行嚴格要求和客觀的評價，對學生「網開一面」酌現象比比皆是，學生輕而易舉得到了教師所給的高分數、好評價，因為給低分甚至掛科多的老師下學期選課人數和教師評比中就會差於其他老師。

但是問題在於，學生們在評價教師的時候是先於教師評學，學生不知道教師給自己的期末測評分數，這樣就構成了不完全資訊動態的博弈。

然而，目前的現狀是，學生評教隨意，教師評學更隨意，師生之間的這種保證教學質量的互評制度為何逐漸背離了最初設計的價值目標?為何逐步喪失評價促進教育教學的應有功能呢?我們如何解釋這種現象的發生?

又如何破解這個難題呢?本文將從博弈論的這一全新視角對這種評價制度乏力現象進行深入剖析，為釐清問題根源、找出解決辦法提供一種思路和方法。

2.文獻綜述：

完全資訊動態博弈，是指博弈中資訊是完全的，即雙方都掌握參與者對他參與人的戰略空間和戰略組合下的支付函式有完全的了解，但行動是有先後順序的，後動者可以觀察到前者的行動，了解前者行動的所有資訊，而且一般都會持續乙個較長時期。

在不完全資訊條件下，博弈的每一參與人知道其他參與人的有哪幾種型別以及各種型別出現的概率，即知道「自然」參與人的不同型別與相應選擇之間的關係，但是，參與人並不知道其他的參與人具體屬於哪一種型別。由於行動有先後順序，後行動者可以通過觀察先行動者的行為，獲得有關先行動者的資訊，從而證實或修正自己對先行動者的行動。

3.評教與評學構成了博弈關係

博弈論的指導思想是，人在做決定時必須要考慮到其他與自己有關係的人所作的決定或可能作的決定對自己所做決定的影響。假設你的對手在研究你的策略並追求自己最大化的利益行動的時候，你如何選擇最有效的策略，並開始考慮他人又會如何對你的策略做出反應時，你便進入了博弈論的領域。博弈論研究的主要問題是人們在互動行為中的推理問題，就是在人們的利益和行為有直接的相互影響和作用的情況下個體的理性選擇與策略。

在博弈論中，理性人的假設是其存在的前提。所謂的理性人是指具有推理、決策能力並通過選擇策略使自己的得益或支付最大的人，也就是完全理性或充分理性的人。什麼樣的人屬於完全理性的人呢?

通俗地講，完全理性就是指博弈主體事事、時時都理性，永不犯錯的人，這跟新制度經濟學中的有限理性人有本質的區別。而理性就是指人能夠在給定的約束條件下最大化自身利益。從對博弈論的闡釋我們不難得出博弈關係發生的三種構成要件：

第一，必須是存在能夠彼此影響對方行為抉擇的兩類主體，也即必須存在著互動關係；第二，這兩類主體必須都有追求自身利益最大化的理性要求而視對方抉擇做出相應的抉擇變化，也即存在利益追求的動機；第三，這兩類主體必須具備自主決定自身行為的自由和能力，也即具有行動力和權力。

對照博弈論基本原理和博弈關係存在的構成要素，我們不難得出教師評學與學生評教之間的互動與行為決策就是一種博弈關係。從互動關係看，教師評學能影響學生評教行為，學生評教也能夠影響到教師評學；從利益追求的動機看，教師和學生都是有著自身利益追求的人，學生希望教師給高分，課程容易，教師希望獲得學生的好評，實現彼此自身利益最大化是其行為決策的重要依據。儘管事實證明，在社會關係的互動中，每個人都實現自身利益最大化是不可能的，但是，只要存在一定範圍的人實現了自身利益最大化的現象就不能阻止人們對自身利益最大化的追求；從行動力和權力看，評學和評教讓教師和學生各自分享了教育評價的權力，學生擁有評教的權力，讓教師評學時不能不考慮學生的感受。

同樣，教師擁有評學權力讓學生在評教過程中不敢過分苛刻，這就為師生雙方爭取和實現各自的利益訴求奠定了權力基礎。

正是由於這種博弈關係的存在，博弈論中一報還一報的策略與默契便在師生之間悄悄達成子，當然師生由於彼此的牽制，也可能產生相互之間的合作，即如中國古語中教師放水，學生也放水。根據阿克塞爾羅德的觀點，博弈雙方一報還一報的默契是這樣實現的：先有第一步的合作，博弈的另一方重複對方上一步的選擇。

一報一報的默契具有如下特點：它是善良的，決不會首先背叛，也是可激怒的，將會被對方的背叛行為所激怒並進行報復。在未來對現在有足夠大的影響，也即博弈雙方存在長期關係時，一報還一報策略具有不可侵入性。

如果乙個群體內所有成員都採取一報還一報策略，它將會是集體穩定的，沒有人能夠通過採用其他策略而幹得更好。這種基於回報的合作一旦建立起來，就能防止其他不太合作的策略的侵入。

正是在這種一報還一報的實踐策略中，師生之間並進行了類似合作還是背叛的兩種情形的博弈，以爭取自身最大的利益訴求。

4.完全靜態資訊博弈：

（1）假設博弈方教師1和博弈方學生2，並且教師和學生都是完全理性的，他們的行為取決於最終受益。

（2）由於資訊是靜態的，雙方都對對方給出自己的評價資訊充分掌握，那麼會出現如下收益情況：博弈方1代表教師，的抉擇博弈方2代表學生的抉擇。而每一種抉擇都會產生不同的結果，從而構成四種博弈結果。

第一種博弈結果是教師和學生都選擇合作，教師評學時給學生高分10分，學生評教也給教師高分10分，達到了師生互利雙贏的效果。第二種博弈結果是，教師採取合作的抉擇，給學生最高分10分，而學生做出背叛的抉擇，評教時給教師5分。這種博弈結果中，教師利益受損而學生獲益，這是一種不均衡狀態，理性的教師不期望這種結果的發生。

第三種博弈結果是，教師採取背叛的決策，學生做出合作的決策，教師評學時給學生5分，而學生評教時給教師10分，這也是一種不均衡狀態，理性的學生不願這種情形的發生。第四種博弈結果是，教師和學生都選擇背叛，都給對方5分，這樣雙方利益都受損，這也不符合師生雙方利益最大化的理性追求。因而，最保險、最有效的方式就是通過暗示的方式實現雙方合作，實現了各自利益最大化的追求，達到帕累託最優的效果，達成均衡狀態。

（3）每個博弈方的行為選擇基於該行為可為他們帶來的收益。

是合作還是背叛呢?作為理性的大學師生圍繞著自身利益最大化的目標展開彼此互動的行為博弈。為了清晰地展示教師評學與學生評教之間的博弈關係，我們借助於囚徒困境中博弈圖表的形式加以呈現，力圖更直觀地揭示出當前評學與評教之間的矛盾。

基於以上假設條件，我們可以得出博弈方1和2的博弈矩陣：

從以上模型向我們揭示了教師和學生為實現自身利益最大化追求而選擇合作的可能性。當博弈的雙方具備如下四個因素就可以實現有效合作。這四個因素是：

(1)必須符合無限重複的要求； (2)具有博弈參與者的可靠資訊；(3)合作的長遠利益大於暫時背叛帶來的利益；(4)威脅的可信性和反應的迅速性。教師評學和學生評教對立統一關係具備了這四方面因素。在無限董復的要求方面，學生對教師高台貴手的要求，既有平時的高分和寬鬆的要求，又有期末考試的評分要求，教師對學生的要求，不僅是最終的評教分數，他希望學生對自己保持著較高的評價和尊敬愛戴，而不是隨著這門課程的結束而終止了良好的師生關係。

在博弈參與者可靠的資訊方面，教師和學生在一學期甚至一學年的教學過程中對彼此的資訊都較充分地掌握，能夠獲得對方可靠的資訊。在合作利益大於背叛利益方面，在威脅的可信性和反應的迅速性方面，師生的評學和評教體現得非常明顯。這些要素的兼備讓教師和學生進行密切合作的概率大大提高。

5.不完全資訊動態博弈

對於誠信行為的不完全資訊動態博弈，我們做如下的假設：

（1）存在博弈方1代表教師和博弈方2代表學生，且二者都是完全理性經濟人。

（2）博弈方1做一件事的成本為a，這件事的總收益為，其中給博弈方1帶來的收益的比率為1-s，給博弈方2帶來的收益的比率為s。

（3）博弈方1有兩種行為，合作或不合作。合作時給博弈方2帶來的收益為h；不合作時給博弈方2帶來的收益為l。

（4）博弈方2根據s判斷博弈方1合作的概率為p（h|s）=p， p（l|s）=1-p。

（5）博弈方2有兩種行為選擇，合作或不合作。另外，博弈方2聽從其他人建議的收益為w。

因此，根據博弈方1和博弈方2的收益分析得：

博弈方2：s[ph+(1-p)l]>w

博弈方1：（1-s）>a

求解得：s>

s<因此，要滿足「博弈方1主動表明合作願望，博弈方2選擇與博弈方1合作」及相應判斷成為合併貝葉斯均衡的前提條件：

<由上式可得：當p=1時，，即當博弈方2選擇與博弈方1合作時，博弈方1只需要付出較小的成本就能獲得更大的收益。即獲得博弈方2的合作會更加容易。

當p=0時， ,即當博弈方2不相信博弈方1的合作願望時，博弈方1必須付出以較大的成本和獲得較小的收益，才能獲取博弈方2的信任，成立合併貝葉斯均衡。

綜上所述，只有在博弈的一方充分表達了合作的願望，有足夠的誠意，雙方才能夠得到雙贏。因而在現實中，事實也證明，教師與學生之間有著心照不宣的合作。從筆者所在大學的情況拉看看，教師和學生之間已經實現了默契合作，而率先發出合作訊號的往往是教師。

很多師在開課之前就向學生承諾，只要大家積極配合，這門課程每個人都能過關，以往各屆學習這門課程的學生都獲得了高分。這種宣言或承諾無疑是向學生丟擲主動要求合作的橄欖枝。此外，教師還在平時作業要求和教學安排上多以學生喜好為轉移。

這一系列的舉動早已被穎悟的學生心領神會了，學生在最後的評教時往往予以積極的配合，實現了學生和教師的雙贏。但這種雙贏是以降低教育教學標準為代價的，是低水平的雙贏，是有害於學生可持續發展的雙贏。

當然，學生評教和教師評學有時候也會出現師生雙方採取背叛策略，造成兩敗俱傷的結局。雙贏與兩敗俱傷這兩種極端的狀態都不能發揮出評價制度應有的評價促進功能，都是一種制度乏力的一種表徵，需要亟待破解。

期末師生互評制度的博弈分析

團隊績效問題的博弈分析

團隊績效問題的博弈分析

基於博弈論的制度有效性分析

期末師生互評制度的博弈分析

團隊績效問題的博弈分析

團隊績效問題的博弈分析

基於博弈論的制度有效性分析

相關推薦