數學建模參考

2021-03-24 17:15:47 字數 4959 閱讀 6355

摘要本文主要針對葡萄酒的評價問題建立了相關數學模型。在對兩組評酒員的評價是否存在顯著性差異的問題中,首先驗證了兩組評酒員的評價結果服從正態分佈,並通過方差分析法對兩組評酒員的評價結果進行了分析,發現兩組評酒員對於紅葡萄酒和白葡萄酒的評價結果均存在顯著性差異,由於第二組評酒員的評分方差更小,故評價結果均衡度更好,其結果可信度更大。

在對釀酒葡萄進行分級的問題中,首先以相關係數衡量葡萄理化指標與葡萄酒質量的相似性程度,然後篩選出與葡萄酒質量相關性較大的理化指標與葡萄酒質量一起作為評估葡萄質量的評價指標,利用篩選出的評價指針對釀酒葡萄進行聚類分析,將紅葡萄和白葡萄均分成了四類。最後以每類中對應葡萄酒質量評分的均值作為該類葡萄的分數,從而定出四類的級別,以對應國家葡萄酒的四級分類標準。

在分析釀酒葡萄與葡萄酒的理化指標間的聯絡問題中,本文採用偏最小二乘回歸分析法對指標間的聯絡進行了分析計算,發現葡萄酒中的某些理化指標與葡萄的某些理化指標存在較強的相關性,比如白葡萄中的總糖和還原糖對白葡萄酒中順式白藜蘆醇苷和順式白藜蘆醇以及反式白藜蘆醇的影響較大。

在判斷葡萄與葡萄酒的理化指標與葡萄酒的質量間關係的問題中,首先對葡萄和葡萄酒的理化指標與葡萄酒的質量進行了相關性分析,發現某些理化指標與葡萄酒的質量相關性很大。然後篩選出這些相關性較大的指標,用偏最小二乘回歸分析法進一步定量分析了這些指標與葡萄酒質量的關係,建立了葡萄酒質量的評價模型,經過檢驗,利用建立的評價模型對葡萄酒評價結果與專家組的評價結果誤差普遍小於5%,這同時論證了用葡萄和葡萄酒的理化指針對葡萄酒進行評價是基本可行的。

關鍵字:顯著性檢驗;聚類分析 ;偏最小二乘回歸分析法

1 問題的重述

確定葡萄酒質量時一般是通過聘請一批有資質的評酒員進行品評。每個評酒員在對葡萄酒進行品嚐後對其分類指標打分,然後求和得到其總分,從而確定葡萄酒的質量。釀酒葡萄的好壞與所釀葡萄酒的質量有直接的關係,葡萄酒和釀酒葡萄檢測的理化指標會在一定程度上反映葡萄酒和葡萄的質量。

建立數學模型討論下列問題:

(1)分析兩組評酒員的評價結果有無顯著性差異,哪一組結果更可信?

(2)根據釀酒葡萄的理化指標和葡萄酒的質量對這些釀酒葡萄進行分級。

(3)分析釀酒葡萄與葡萄酒的理化指標之間的聯絡。

(4)分析釀酒葡萄和葡萄酒的理化指針對葡萄酒質量的影響,並論證能否用葡萄和葡萄酒的理化指標來評價葡萄酒的質量?

2 問題的分析

對於問題(1),兩組評酒員分別對27種紅葡萄酒和28種白葡萄酒進行了評價,通常情況下,評價結果一般服從正態分佈,所以首先應當對評價資料進行擬合檢驗法[1],然後利用方差分析對兩組評酒員的評價結果進行顯著性分析。乙個較好的評價組應是本著客觀的原則進行評價,因此評價結果通常較為均勻,據此,可以分別計算出各組評酒員評價結果的方差,方差越大表明組內成員的評價差異越大,可信度就越低。

對於問題(2),題目要求根據釀酒葡萄的理化指標和葡萄酒的質量對釀酒葡萄進行分級,首先就必須從這些指標中找到與釀酒葡萄分級有關的指標。考慮到釀酒葡萄的用途是釀製葡萄酒,因此葡萄酒的質量可以作為衡量釀酒葡萄質量的重要指標。而那些與葡萄酒質量相似性程度較大的釀酒葡萄理化指標也應作為釀酒葡萄的評估價指標。

採用計算相關係數的方法計算兩者間相似性程度,選定合適的相關係數為界線即得出釀酒葡萄質量評價指標。在釀酒葡萄質量指標確認後,採取聚類分析的方法對釀酒葡萄進行分類。分類後,各類中葡萄釀製葡萄酒的質量得分即作為各類分數,從而分出釀酒葡萄的級別。

對於問題(3),要求對葡萄與葡萄酒的理化指標的聯絡進行分析,葡萄的二級理化指標有50多種,葡萄酒的理化指標有15種左右,並且各個指標間可能存在較大的關聯度,研究兩組多重相關變數間的關係問題,可以考慮用偏最小二乘回歸分析法。

對於問題(4),首先利用問題(2)中相關性分析法和聚類分析法,篩選出與葡萄酒質量關聯度較大的一些關鍵指標。經過去除掉對葡萄酒質量影響較小的指標,不僅可以簡化計算,而且在實際研究中,工作人員只需測量這些關鍵指標即可,減少了工作量。然後利用偏最小二乘回歸分析法,分析篩選後的指標與葡萄酒質量的函式關係,進而得到對葡萄酒質量的評價模型。

為檢驗所建評價模型的準確性,可以考慮將樣本資料分成兩部分,一部分資料用於分析計算評價模型,然後利用另一部分資料對模型進行檢驗。如果說誤差較小,則說明所建評價模型較為滿意,同時也論證了用理化指針對葡萄酒的質量進行評價的可行性。

3 模型的假設

(1) 釀酒葡萄的釀造水平與釀造環境相同;

(2) 釀製同一種酒使用的葡萄是相同的;

4 符號說明

:第一組評酒員中第個評酒員對第種紅葡萄酒的第個理化指標的評分;

:第一組評酒員中第個評酒員對第種紅葡萄酒的總評分;

:第一組評酒員對第種紅葡萄酒評價結果的方差;

:第個指標與第個指標間的相關係數。

5 模型的建立與求解

5.1 兩組評酒員評價結果的差異分析

5.1.1 資料的處理與準備

根據題意,共有兩組評酒員,每組有十個成員,每個評酒員在評價任意一種酒時,均考慮了四項一級指標和十項二級指標,每種酒的評價滿分為100分,其中各個指標所佔分值如表1所示。為方便計,將各個二級指標按照表1中從左至右的順序依次編為1—10號。

表1 各指標所佔分值

記,分別表示第一組評酒員中第個評酒員,對第種紅葡萄酒第個二級指標的評分和對第種紅葡萄酒的總評分,,分別表示第二組評酒員中第個評酒員,對第種紅葡萄酒第個二級指標的評分和對第種紅葡萄酒的總評分,,,,則有

假設把每一組所有評酒員對第種紅葡萄酒的平均評分,作為該組對該種紅葡萄酒的最終評分,分別用,表示第一組和第二組對第種紅葡萄酒的最終評分,則

同樣,記,分別表示第一組評酒員中第個評酒員,對第種白葡萄酒第個二級項指標的評分和第種白葡萄酒的總評分,,分別表示第二組評酒員中第個評酒員,對第種白葡萄酒第個二級指標的評分和第種白葡萄酒的總評分,,。則

分別用,表示第一組和第二組對第種白葡萄酒的最終評分,。則

現以第1號紅葡萄酒為例,分析兩組評酒員評價結果的分布情況。20個評酒員對第1號酒的評分依次為70,79,91,68,97,82,69,80,81,76,68,71,80 ,52 ,53 ,76,71,73,70,67。以10分為間距,統計落入各個區間資料的個數,結果見表2.

表2 評分結果分布統計

可以看出,20個評酒員對1號紅葡萄酒的評分結果呈現出兩頭少中間多的分布。下面利用擬合檢驗法[1]檢驗評價結果是否服從正態分佈(取顯著性水平)。

原假設:樣本服從正態分佈。計算引數及的極大似然估計值分別是,.

計算出落入5個區間的頻率依次為0.1,0.2,0.

4,0.2,0.1.

經過查卡方分布表,,而,所以接受原假設,即20個評酒員對1號紅葡萄酒樣品的評分可視為服從正態分佈。類似地,其他54種酒的評價結果經檢驗均服從正態分佈。

5.1.2 兩組評價結果分析

計算出兩組評酒員對各種酒的評分情況,見圖1.

圖1 兩組最終評分均值

通過圖1總結出,兩組評酒員對於55種酒的評分走勢大致相同,但對於紅葡萄酒的評價,第一組的評分普遍高於第二組;對於白葡萄酒的評價,第一組的評分普遍低於第二組。針對第種酒,兩組評酒員的評分標準可能不同,主觀性較大。為檢驗兩組評酒員的評價結果是否存在顯著性差異,可進一步對兩組評價結果進行檢驗[1]。

以紅葡萄酒為例,第一組的十個評酒員對第種紅葡萄酒的評分構成樣本,,第二組的十個評酒員對第種酒的評分作為構成,。兩個樣本的容量為10,自由度為9。兩樣本的均值分別記作,標準差分別記作,則

兩樣本總自由度為18,合併的標準差,

進一步計算相應的,

提出假設:兩個樣本差異不顯著。備擇假設:

兩個樣本差異顯著。通常顯著水平,即置信概率為95%。經過查分布表知,自由度為18時,。

故當時,接受原假設,表明兩組評酒員對第種紅葡萄酒的評價結果差異不顯著;故當時,拒絕原假設,表明兩組評酒員對第種紅葡萄酒的評價結果差異顯著。

經過上述計算,兩組評酒員對27中紅葡酒和28種白葡萄酒的評價差異結果如表3所示(其中,1表示兩組評價結果不顯著差異,0表示顯著差異)。

表3 各種酒的評價差異性

兩組評酒員對於55種酒的評價,總計有37種存在顯著性差異,佔總數的67.3%。其中紅葡萄酒17種,佔紅葡萄酒總數的63.

0%,白葡萄酒20種,佔白葡萄酒總數的71.4%,差異性略高於紅葡萄酒。因此,兩組評酒員對於這些酒的評價普遍存在顯著性差異,為了得到更為準確客觀的評價結果,必須分別對各組評酒員的評價結果進一步分析,比較兩組評價的可靠性。

乙個好的評價組在評價某種酒時,每乙個成員應當本著客觀性的評價原則對酒的各項指標進行評分,盡量避免主觀影響。因此好的評價組對於同一種酒的評價結果通常更為均衡,不會出現高分和低分居多,而中等分數偏少的現象。所以,組員評價結果的均衡度在很大程度上表徵了該評價組評價結果的可信度,而表現均衡度大小的資料就是評價樣本的方差,方差越大,均衡度越小,評價組的可信度越低,反之亦然。

對於第種紅葡萄酒,第一組的十個評酒員對第種紅葡萄酒的評分構成樣本,,第二組的十個評酒員對第種酒的評分作為構成,。記兩樣本的方差為,則

根據上式依次分別計算出,兩組評酒員對27種紅葡萄酒和28種白葡萄酒評價結果的方差,結果見圖2.

圖2 兩組組評酒員評價結果方差

通過圖2,可以看出,第一組評酒員對於各種酒評價結果的方差絕大部分大於第二組,這說明第一組評酒員在評價同一種酒時,組內成員的標準或認識差異較大,評價結果過於離散,均衡度較差,可信度也就較低,因此可以斷定,第二組評酒員的評價結果更可信。

5.2釀酒葡萄分級模型

欲對釀酒葡萄進行分級,首先應當確定適當的分級指標。然而對於題目要求的釀酒葡萄的理化指標和葡萄酒的質量這些指標中既可能存在指標間存在較強的相關性的情況,又可能存在一些指標與釀酒葡萄的分級關係微小。因此,有必要對所給指標進行分析。

題目提供的釀酒葡萄的理化指標中的部分指標具有二級指標,為了更為細緻準確的分析各指標與葡萄酒質量的關係,對於有二級指標的一級指標,只考慮其二級指標,將該一級指標去除。然後按照剩下指標的原始順序進行順序編號,共有55個葡萄理化指標,記作。將葡萄酒質量編號為56,即對於個指標,第種葡萄樣品的值為

5.2.1 由相關係數確定評估葡萄質量指標

因為釀酒葡萄是用來釀葡萄酒的,因此,釀成葡萄酒的質量也就成為了判別釀酒葡萄的最重要指標。題目提供了釀酒葡萄的50多種指標,然而對於這些指標未必每項都對釀製的酒有影響,或者說產生的影響是可以忽略的。所以有必要對釀酒葡萄的理化指標與釀酒質量進行相似性度量,從而找出與釀酒質量相關程度較大的指標。

下面通過計算相關係數衡量這些指標間的相似程度。

數學建模參考

2014高教社杯全國大學生數學建模競賽 相關參考書籍資料 一 數學建模 寫作相關 1 高教杯全國大學生數學建模大賽歷年獲獎 2 數學建模優秀 精選與點評 2005 2010,李學文,李炳照,王巨集洲主編,清華大學出版社 3 數學建模競賽 獲獎 精選與點評,韓中庚,科學出版社 二 數學建模相關教材 1...

數學建模參考文章

第3段 對於問題 2 我們用。第4段 對於問題 3 我們用。如果題目單問題,則至少要給出 2 種模型,分別給出模型的名稱 思想 軟 件 結果 亮點詳細說明。並且一定要在摘要對兩個或兩個以上模型進行比較,優勢較大的放後面,這兩個 模型 一定要有具體結果。第5段 如果在 條件下,模型可以進行適當修改,這...

數學建模感受

3.由於知識產生和發展過程本身就蘊含著豐富的數學建模思想,因此老師既要重視實際問題背景的分析 引數的簡化 假設的約定,還要重視分析數學模型建立的原理 過程,數學知識 方法的轉化 應用,不能僅僅講授數學建模結果,忽略數學建模的建立過程。4.數學應用與數學建模的目的並不是僅僅為了給學生擴充大量的數學課外...