1對策論的基本概念

2022-12-19 17:09:05 字數 5434 閱讀 3686

對策模型的三個基本要素:1.局中人:參與對抗的各方;

2.策略集:局中人選擇對付其它局中人的行動方案稱為策略;某局中人的所有可能策略全體稱為策略集;

3.一局勢對策的益損值:局中人各自使用乙個對策就形成了乙個局勢,乙個局勢決定了各局中人的對策結果(量化)稱為該局勢對策的益損值。

「齊王賽馬」齊王在各局勢中的益損值表(單位:千金)

§1對策論的基本概念

其中:齊王的策略集:s1=,田忌的策略集:s2=。下面矩陣稱齊王的贏得矩陣:

3111-11

13111-1

a=1-13111

-111311111-131

11-1113

§1對策論的基本概念

二人有限零和對策(又稱矩陣對策):

局中人為2;每個局中人的策略集的策略數目都是有限的;每一局勢的對策均有確定的損益值,並且對同一局勢的兩個局中人的益損值之和為零。

通常將矩陣對策記為:g=

s1:甲的策略集;s2:乙的策略集;

a:甲的贏得矩陣。

「齊王賽馬」是乙個矩陣策略。

§2矩陣對策的最優純策略

在甲方的贏得矩陣中:

a=[aij]m×n

i行代表甲方策略i=1, 2,…, m;j行代表乙方策略j=1, 2,…, n;aij代表甲方取策略i,乙方取策略j,這一局勢下甲方的益損值。此時乙方的益損值為-aij(零和性質)。

在考慮各方採用的策略時,必須注意乙個前提,就是雙方都是理智的,即雙方都是從各自可能出現的最不利的情形選擇一種最為有利的情況作為決策的依據。

§2矩陣對策的最優純策略

例:甲乙桌球隊進行團體對抗賽,每隊由三名球員組成,雙方都可排成三種不同的陣容,每一種陣容可以看作一種策略,雙方各選一種策略參賽。比賽共賽三局,規定每局勝者得1分,輸者得-1分,可知三賽三勝得3分,三賽二勝得1分,三賽一勝得-1分,三賽三負得-3分。

甲隊的策略集為s1=,乙隊的策略集為s2=。根據以往比賽的資料,有甲隊的贏得矩陣為a,如下所示,

請問這次比賽各隊採用哪種陣容上場最為穩妥?

§2矩陣對策的最優純策略

矩陣a中每行的最小元素分別為1,-3,-1。

在這些最少贏得中最好的結果是1,故甲隊會採取策略1,無論對手採取何策略,甲隊至少得1分。對於乙隊,可能帶來的最少贏得,即a中每列的最大元素,分別為3,1,3。乙隊會採取2策略,確保甲隊不會超過1分。

1和2分別稱為局中人甲隊、乙隊的最優策略。由於雙方必然選擇這一種策略,所以,這種策略又稱為最優純策略。

這種最優純策略只有當贏得矩陣a=(aij)中等式

成立時,雙方才有最優純策略,並把(1,2)稱為對策g在純策略下的解,又稱(1,2)為對策g的鞍點。把其值v稱之為對策g=的值。

§2矩陣對策的最優純策略

例某單位採購員在秋天決定冬季取暖用煤的儲量問題,已知在正常的冬季氣溫條

件下要消耗15噸煤,在較暖和較冷的天氣下要消耗10噸和20噸。假定冬天的煤價隨天氣寒冷程度而有所變化,在較暖和、正常、較冷的氣候條件下每噸煤價分別為10元、15元、20元。又設冬季時煤炭**為每噸10元。

在沒有關於當年冬季準確的氣象預報的條件下,秋天儲煤多少噸能使得單位的支出最少?

解:局中人i為採購員,局中人ii為大自然,採購員有三個策略,買10噸、15噸、20噸。分別記為1,2,3。大自然也有三個策略:暖、正常、冷,分別記為1,2,3。

§2矩陣對策的最優純策略

贏得矩陣如下:

在此表上計算,有

得故(3,3)為對策g的解,vg=-200。

設矩陣對策g= 。當

max minaijmin maxaij

ijji

時,不存在最優純策略。

例:設乙個贏得矩陣如下:min5 9 5

amax 6策略28 6 6i

max 8 9

min 8策略1

j當甲取策略

,乙取策略1時,甲實際贏得8比預期的多2,乙當然不滿意。考慮

到甲可能取策略2這一點,乙採取策略2。若甲也分析到乙可能採取策略2這一點,取策略1,則贏得更多為9…。此時,對兩個局中人甲、乙來說,沒有乙個雙方均可接受的平衡局勢,其主要原因是甲和乙沒有執行上述原則的共同基礎,即max minaijmin

2maxaij。

ijji

乙個自然的想法:對甲(乙)給出乙個選取不同策略的概率分布,以使甲(乙)在各種情況下的平均贏得(損失)最多(最少)-----即混合策略。

求解混合策略的問題有**法、迭代法、線性方程法和線性規劃法等,我們這裡只介紹線性規劃法,其他方法略。例:設甲使用策略1的概率為x1′,使用策略2的概率為x2′,並設在最壞的情況下,甲贏得的平均值為v(未知)。

59a=step 1

861)

2)無論乙取何策略,甲的平均贏得應不少於v:

對乙取1:5x1』+ 8x2』v對乙取2:9x1』+ 6x2』v

注意v>0,因為a各元素為正。step 2

作變換:x1= x1』/v ; x2= x2』/v得到上述關係式變為:

x1+ x2=1/v (v愈大愈好)待定5x1+ 8x219x1+ 6x21x1, x20

建立線性模型:min x1+x2

5x1+8x21x1= 1/219x1+6x21x2= 2/21

x1, x201/v= x1+x2=1/7所以,v=7返回原問題:x1』= x1v= 1/3x2』= x2v= 2/3於是甲的最優混合策略為:

以1/3的概率選1,以2/3的概率選2,最優值v=7。

x′′1+x2=1

x′1, x′20

例:求解「齊王賽馬」問題。

已知齊王的贏得矩陣a求得

故不存在純策略問題下的解,可求其混合策略。

a中有負元素,可以取k=2,在a的每個元素上加2得到a』如下:

建立對g=中求甲方最佳策略的線性規劃如下:′′

min x1+x2+x3+x4+x5+x6約束條件:

5x1+3x2+3x3+x4+3x5+3x6≥13x1+5x2+x3+3x4+3x5+3x6≥13x1+3x2+5x3+3x4+3x5+x6≥13x1+3x2+3x3+5x4+x5+3x6≥1x1+3x2+3x3+3x4+5x5+3x6≥13x1+x2+3x3+3x4+3x5+5x6≥1xi≥0,i=1,2,…,6

可解得解為:x1=x4=x5=0, x2=x3=x6=0.111, v=3, x1=x4=x5= 0,

x2=x3=x6=1/3,即x=(0,1/3,1/3,0,0,1/3),所以甲的最優策略為作出策略2、3、6的概率都為0.333,而作出1、4、5的概率為0,此時vg=v=3。′′

′′′′*

t′′′

′同樣可以建立對策g=中求乙方最佳策略的線性規劃如下:min y1+y2+y3+y4+y5+y6約束條件:

5y1+3y2+3y3+3y4+y5+3y6≤13y1+5y2+3y3+3y4+3y5+y6≤13y1+y2+5y3+3y4+3y5+3y6≤1y1+3y2+3y3+5y4+3y5+3y6≤13y1+3y2+3y3+y4+5y5+3y6≤13y1+3y2+y3+3y4+3y5+5y6≤1yi≥0,i=1,2,…,6可解得解為:′′

y1=y4=y5=0.111, y2=y3=y6=0, v=3, y1=y4=y5= 1/3,y2=y3=y6=0,即y-k=1。′′

′′*′′′′

=(1/3,0,0,1/3,1/3,0)。

t所以田忌的最優混合策略為作出策略1、4、5的概率都為1/3,而作出2,3,6的概率為0,此時vg=vg

′齊王賽馬問題的對策最優解可簡記為x=(0,1/3,1/3,0,0,1/3),y=(1/3,0,0,1/3,1/3,0),對策值vg=1。

例兩個局中人進行對策,規則是兩人互相獨立的各自從1、2、3這三個數字中任意選寫乙個數字。如果兩人所寫的數字之和為偶數,則局中人乙支付給局中人甲以數量為此和數的報酬;如果兩人所寫數字之和為奇數,則局中人甲付給局中人乙以數量為此和數的報酬。試求出其最優策略。

解:首先計算局中人甲的贏得矩陣如下表:*t

*t即甲的贏得矩陣為a:

可知無純策略意義的解,下面求其在混合策略下的解。a的各元素都加上6,得到

建立線性規劃模型如下:

min x1+x2+x3max y1+y2+y3

得到x1′=0.25, x2′=0.50, x3′=0.25;y1′=0.25, y2′=0.50, y3′=0.25。

即此對策的解為

x*=(0.25,0.50,0.25)t,y*=(0.25,0.50,0.25)t。vg=vg′-k=0。

例4甲乙兩個企業生產同一種電子產品,甲企業可以採取的策略措施有:(1)降低產品**;(2)

提高產品質量;(3)推出新產品。乙企業考慮採取的策略措施有(1)增加廣告費用;(2)增設維修網點,加強售後服務;(3)改進產品效能。由於甲乙兩個企業財力有限,都只能採取乙個措施。

假定這兩個企業所占有的市場總份額一定,由於各自採取的措施不同,通過**今後兩個企業的市場占有份額變動情況如下表,試求出這兩個企業各自的最優策略。

解:易知此對策無純策略意義下的解。把a的每乙個元素加上12,得到a

′建立線性規劃模型如下:

min x1+x2+x3max y1+y2+y3

得到:x1=0.027,x2=0.

020,x3=0.023;y1=0.0225,y2=0.

0225,y3=0.025。v=14.

29。x1=0.3858, x2=0.

2858, x3=0.3286;y1=0.3215,y2=0.

3215,y3=0.3572。即此對策的解為x=(0.

3858,0.2858,0.3286),y=(0.

3215,0.3215,0.3572)。

vg=vg-k=2.29。′*

t*t′

′′′′

′優超原則:

假設矩陣對策g =甲方贏得矩陣a=[aij]mn

若存在兩行(列),s行(列)的各元素均優於t行(列)的元素,即

asjatjj=1,2…n ( aisaiti=1,2…m )

稱甲方策略s優超於t(s優超於t)。

優超原則:當局中人甲方的策略t被其它策略所優超時,可在其贏得矩陣a中劃去第t行(同理,當局中人乙方的策略t被其它策略所優超時,可在矩陣a中劃去第t列)。如此得到階數較小的贏得矩陣a』,其對應的矩陣對策

g』=與g =

等價,即解相同。

例.設甲方的益損值,贏得矩陣為

32030被第3、4行所優超50259被第3行所優超a= 7395946875.560883得到

73959被第1列所優超a1=46875.5被第2列所優超60883

對a4計算,用線性規劃方法得到:

(注意:餘下的策略為3,4,1,2)甲:x*= (0,0,1/15,2/15,0)tv=5x*』= (0,0,1/3,2/3,0)t乙:

y*= (1/10,1/10,0,0,0)tv=5y*』= (1/2,1/2,0,0,0)t。注:

–利用優超原則化簡贏得矩陣時,有可能將原對策問題的解也劃去一些(多解情況);

–線性規劃求解時有可能是多解問題。

磁場的基本概念

第四十一課時磁場的基本概念 主備人 周霽審定人 張志永日期 2013.12.24 高考要求 學習目標 1 掌握磁感應強度 磁感應線和磁通量的概念 2 會用安培定則 磁感應線分析有關問題。自學檢測 知識梳理 一 磁場 1 定義 存在於磁體和電流周圍的一種 2 基本性質 對放入其中的產生力的作用。3 方...

第1講描述運動的基本概念

必修一第一章運動的描述勻變速直線運動的描述 1.圖1 1 8 小明週末到公園坐摩天輪 如圖1 1 8所示 已知該輪直徑為80 m,經過20 min轉動一周後,小明落地,則小明在摩天輪上的平均速度為 a 0.2 m sb 4 m s c 0d 非直線運動,不能確定 解析 平均速度是指位移和所用時間的比...

練習1描述運動的幾個基本概念

一 選擇題 1 2014年7月28日至8月2日第十二屆全國 會在上海舉行。競技水平總體較上屆明顯提高,下列關於質點的說法正確的是 a 研究桌球運動員比賽中發出的弧旋球時,可以把桌球視為質點 b 足球運動員踢出的沿曲線飛行的足球一定能視為質點 c 參加健美操比賽的運動員正在完成動作時可視為質點 d 參...