最經典數學建模Fisher模型

疾病診斷問題

摘要文中研究的是通過已給出的資料對其四項生化指標：血清銅藍蛋白(x1)、藍色反應(x2)、鳥吲哚乙酸（x3）、中型硫化物（x4）進行分析，得出健康綜合指數的臨界值，從而協助醫生診斷就診人員是癌症病人還是萎縮性胃炎病人及健康人。

首先，在合理的假設下，建立了判別分析模型，將表中的資料分為，c三組，由其各自的離差矩陣求得每種指標對應的權重，並得到了健康綜合指數的臨界值，經過檢驗，用此模型診斷的正確率為100%

此外，文中對所建立的模型做了檢驗，誤差分析和評價，並將此模型做了推廣和應用。

關鍵詞綜合指數臨界值權重判別分析

一、問題重述

胃癌患者容易被誤診為萎縮性胃炎患者或非胃病者，據此，通常要化驗人體內四項生化指標：血清銅藍蛋白(x1)、藍色反應(x2)、鳥吲哚乙酸（x3）、中型硫化物（x4），從而用這些指標協助醫生診斷。表中1-5號病例是已經確診為胃癌的病人的化驗結果；6-10號病例是已經確定為萎縮性胃炎病人的化驗結果；11-15是已經確診為健康人的化驗結果。

根據表中的資料，設想使用fisher判別分析法，給出鑑別胃病的方法並對所給的資料進行檢驗，使問題得到有效的解決。

二、問題分析

醫生在診斷就診人員是癌症病人還是萎縮性胃炎病人及健康人。通常要化驗人體內四項生化指標，從而用這些指標協助診斷。由表中看出醫生通常用血清銅藍蛋白(x1)、藍色反應(x2)、鳥吲哚乙酸（x3）、中型硫化物（x4）在人體內的含量作為指標進行診斷。

要判斷就診人員是ⅰ胃癌病人還是ⅱ萎縮性胃炎病人及ⅲ健康人，分別對①胃癌患者與非胃病者及②萎縮性胃炎患者與非胃病者以及③胃癌患者與萎縮性胃炎患者進行分析，分別得出其相對應的健康綜合指數的臨界值（h1，h2，h3）作為判別標準，這是乙個判別分析問題。通過表中的資料分析可得：如果就診人員在情況①下由臨界值h1判斷為胃癌，則在第三種情況下分析，如果由臨界值h3判斷為胃癌，則認為此人患有胃癌；如果判斷為萎縮性胃炎，則此人為萎縮性胃炎患者。

如果在情況①下由臨界值h1判斷為非胃病者，則在第二種情況下分析，如果由臨界值h2判斷為非胃病者，則此人為非胃病者；若判斷為萎縮性胃炎，則此人為萎縮性胃炎患者。要得到就診人員的健康綜合指數，就必須通過表中的資料得到人體內四項生化指標含量的乙個權值（這個權值是恆定的）。

由於各年齡階段人體內各種生化指標的含量是不同的，要使這個臨界值更加準確，就必須消除年齡和體質的差異，所以所抽取樣本應該是隨機的，且這個隨機樣本中就診人員沒有其他病症。

為了使醫生診斷的結果準確，建立判別分析模型，確定健康綜合指數的臨界值和人體內四項生化指標含量的權值。將此權值代入表中進行檢驗，並計算此模型診斷結果的正確率。

三、模型假設及符號說明

1 模型假設

（1）表中的資料是隨機抽取的化驗結果，具有普遍性；

（2）就診人員沒有其他病症，且化驗當天沒有特殊情況；

（3）化驗儀器足夠精確；

（4）除了表中列出的指標外，其它指針對是否患胃癌的影響很小。

（5）檢測是在同等條件下進行的，即同樣的外界環境和生理條件。

2 符號說明

：就診人員健康綜合指數的臨界值；

: 第個就診人員的綜合指數；

：第個就診人員第個指標的權值；

：第個就診人員第個指標的含量；

：第個指標含量的平均值；

：就診人員綜合指數的平均值。

四、模型建立

模型判別分析模型

通常是由化驗結果中x1，x2，x3，x4四種元素作為診斷指標，醫生最終要診斷就診人員是癌症病人還是萎縮性胃炎病人及健康人，就必須確定乙個健康綜合指數的臨界值作為判別標準，因此這是乙個判別分析問題。

故建立判別分析模型

將與健康綜合指數的臨界值作比較，就可診斷就診人員是癌症病人還是萎縮性胃炎病人及健康人。要得到就診人員的健康綜合指數，就必須通過表中的資料得到人體內四種元素含量的乙個權值（這個權值是恆定的）。

為了求得，利用判別準則：

由於表中1-5號病例確診為胃癌患者，6-10號病例確診為萎縮性胃炎患者，11-15號病例確診為非胃病者，故將表中的就診人員分為，c三組：a組為非胃病者，b組為胃癌患者，c組為萎縮性胃炎患者。

組資料矩陣為

c組資料矩陣為

作出，c三組的離差矩陣

則其中，五、模型求解

由式求得h1=-4.9149，h2=1.1364,h3=3.5551，

表 1-15號病例健康狀況的綜合指數

為了使醫生對就診人員的健康狀況做乙個更加準確的診斷，由fisher模型求得就診人員健康狀況的綜合指數。

要得到就診人員健康狀況的綜合指數，由知，首先必須得到每乙個指標對應的權重，利用判別準則：

先將病歷號1-15分為,c三組(a表示非胃病者，b表示胃癌患者，c表示萎縮性胃炎患者)

組資料矩陣

c組資料矩陣

由通過excel分別求得組與組及c組資料每一列的平均值，如表2

表 2 非胃病組a與胃癌組b及萎縮性胃炎組c的資料矩陣每一列的平均值

由矩陣分別求得組與組及c組資料的離差矩陣、（見附錄）

且由、得

根據式有matlab求得

即：健康綜合指數臨界值

其中h1=-4.9149， h2=1.1364, h3=3.5551

將分別代入,c三組資料中用fisher模型進行經檢驗，將組資料代入情況1中分析檢驗的結果是：組資料的0均小於h1，則他們是癌症患者，再代入情況3中分析hi2均大於h2則肯定他們是癌症患者，診斷的正確率為。對組資料分析：

0均大於h1，則他們是非胃病者，再代入情況2中分析hi1均大於h2，則肯定他們是非胃病者，診斷的正確率為100%。對c組資料分析代入情況1中分析出結果不確定，則代入情況2或情況3中分析，都得出他們是萎縮性胃炎患者，則肯定他們是萎縮性胃炎患者，診斷的正確率為100%。對,c三組資料的就診人員總診斷的正確率為100%。

六、模型檢驗及誤差分析

1、模型檢驗

將表中確診病例的化驗結果代入我們所建立的模型中，得到的結論分別是1-5號病例確診為胃癌患者，6-10號病例確診為萎縮性胃炎患者，11-15號病例確診為非胃病者，診斷的正確率分別為100%、、100%這個概率說明我們所建立的模型能應用到實際生活中。

2、誤差分析

（1）模型誤差

表中給出確診病例的化驗結果只有15人，由於資料有限，不能很準確的代表普遍情況。因此我們所建立的模型中判斷的綜合指數是有誤差的。這樣，用模型所檢驗的準確率就達不到。

（2）捨入誤差

在模型的建立過程中，由於資料複雜，我們通過四捨五入的方法來處理資料，這樣得到健康人的綜合指數是有誤差的。

七、模型評價與改進

優點：1. 分析了由判別法得到的結果用來檢驗所給的15組資料，得出診斷的正確率為100%，這說明我們所建立的模型具有實際意義。

2. 當實驗資料非常多時，傳統的方法就不再適用了，只能轉而使用數值計算的相關理論，以發現資料中存在的關聯和規則,此時該模型就具有非常強的實用性。

缺點：文中假設就診人員的病例是隨機抽取的，而人在各年齡階段體內元素的含量存在差異，故會出現誤診情況。

改進：1. 在一級甲等醫院隨機抽取大量確診為癌症病人還是萎縮性胃炎病人及健康人的化驗結果，從而使我們所使用的資料所確定的健康綜合指數臨界值夠精確；

2. 由於人體內四項生化指標含量在人體內是分布不均勻的，通過醫學常識準掌握人體內四項生化指標含量分布情況，進而對模型加以改進，使得對胃病檢驗的準確率提高。

參考文獻

阮曉青，周義倉，數學建模引論，高等教育出版社，2023年7月

盛驟，謝式千，潘承毅，概率論與數理統計（第三版），高等教育出版社，2023年12月

宋來忠，王志明，數學建模與實驗，科學出版社，2023年8月

[5] 附錄

b=[228-188.6,134-150.4,0.

2-0.138,0.11-0.

2;245-188.6,134-150.4,0.

1-0.138,0.4-0.

2;200-188.6,167-150.4,0.

12-0.138,0.27-0.

2;170-188.6,150-150.4,0.

07-0.138,0.08-0.

2;100-188.6,167-150.4,0.

20-0.138,0.14-0.2]

最經典數學建模Fisher模型

數學建模獎學金評定模型

數學建模屋簷水槽模型

2019數學建模A題模型建立

最經典數學建模Fisher模型

數學建模獎學金評定模型

數學建模屋簷水槽模型

2019數學建模A題模型建立

相關推薦