聚類分析熵方法加權方差越大,權重越大

2022-04-08 05:42:16 字數 3105 閱讀 4463

一、 李郭 0809501024 應數081

二、 實驗目的:學習利用距離函式建模的方法,掌握客觀性權重的變異係數以及綜合評價的基本方法,熟練掌握matlab處理矩陣的各種方法。

三、 實驗內容及要求:

問題:近年來我國淡水水質富營養化的汙染日趨嚴重,如何對湖泊水質的富營養化進行綜合評價是擺在我們面前的一項重要任務。表1和表2分別是我國5個湖泊實測資料和水質評價標準。

表3.4 全國5個主要湖泊品和技術引數的實測資料

表3.5 湖泊水質評價標準

a. 是利用以上資料,分析總磷,耗氧量,透明度和總氮這4種指針對湖泊水質富營養化所起作用。

b. 對上述5個湖泊的水質進行綜合評估,確定水質等級。

四、 問題的分析

在進行綜合評價之前,首先要對評價的指標進行分析。通常評價指標分為效益型,成本型和固定型指標(另外還有區間型指標,偏離型指標等等)。在進行綜合評定之前首先對各評定指標同一屬性。

由生物學知識可知,本題除了透明度指標為成本型指標以外,其餘指標都為效益型指標。

在指標清楚之後,我們還要進行賦權和標準化。在初次建立模型的時候我們選擇了:變異係數賦權法和線性比例變換法的標準化方法

五、 模型的建立

根據表3.4和表3.5,我們得到實測資料矩陣x=()和等級標準矩陣y=()

建立無量綱化實測資料矩陣:a=()和無量綱化等級標準矩陣b=()。

其中我們用線性比例變換的標準化方法得到:

利用matlab計算得

b= 計算評價指標的權重

首先計算矩陣b的各行向量的均值與標準差,

然後計算變異係數 (i=1,2,3,4)

利用matlab計算得:w=[0.2767 0.2444 0.2347 0.2442]

w表示個指標的權重。根據權重的大小,即可說明總磷,耗氧量,透明度和總氮4種指針對湖泊水質富營養化所起作用。由上可知個指標的作用很接近,比較而言總磷所起作用最大,耗氧量,總氮次之,透明度的額作用最小。

建立個湖泊水質的綜合評價模型,利用歐氏距離和絕對值距離進行建模

計算a中各行向量到b中各列向量的歐氏距離

若,則第i個湖泊屬於第k級(i=1,2,3,4,5)。

計算a中各行向量到b中各列向量的絕對值距離

若,則第i個湖泊屬於第k級(i=1,2,3,4,5)。

計算結果如下表所示:表3.6 歐氏距離判別表

表3.7 絕對值距離判別表

從上面的計算可知,儘管歐氏距離與絕對值距離意義不同,但是對個湖泊水質的富營養化評價等級是一樣的,表明我們給出的方法具有穩定性。

六、 附錄:用matlab程式設計

x=[130 10.3 0.35 2.

76;105 10.7 0.4 2.

0;20 1.4 4.5 0.

22;30 6.26 0.25 1.

67;20 10.13 0.5 0.

23];

%輸入實測資料矩陣

a1=x(:,1)./max(x(:,1));a2=x(:,2)./ max(x(:,2));a3= min(x(:,3))./x(:,3);

a4=x(:,4)./ max(x(:,4));a=[a1,a2,a3,a4];%輸出用線性比例變換的標準化的實測矩陣

y=[1 4 23 110 660;0.09 0.36 1.

8 7.10 27.1;37 12 2.

4 0.55 0.17;0.

02 0.06 0.31 1.

20 4.60];%輸入等級標準矩陣

b1=y(1,:)./ max(y(1,:));b2=y(2,:)./ max(y(2,:));b3= min(y(3,:))./y(3,:);

b4=y(4,:)./ max(y(4,:));b=[b1;b2;b3;b4];%輸出用線性比例變換的標準化的等級標準矩陣

b=b';t=std(b)./mean(b);w=t/sum(t)%計算等級標準矩陣各指標的變異係數,並賦權重

t=dist(a,b)%計算a中各行向量到b中各列向量的歐氏距離

mandist(a,b)%計算a中各行向量到b中各列向量的絕對值距離

七、 模型的優化:

一.賦權法:熵值法

熵值法主要是依據各指標值所包含的資訊量的大小,利用指標的熵值來確定指標權重的。熵值法的一般步驟為:

◆ (1)對實測矩陣x=()和等級標準矩陣y=()作標準化處理,並對等級標準化矩陣進行行歸一化處理

結果為:

◆ (2)計算第個指標的熵值:。其中。結果為:

◆ (3)、計算第個指標的差異係數。對於第個指標,指標值的差異越大,對方案評價的作用越大,熵值越小,反之,差異越小,對方案評價的作用越小,熵值就越大。因此,定義差異係數為:。

結果為:

◆ (4)、確定指標權重。第個指標的權重。

結果為:,表示每個指標的權重。根據權重的大小,即可說明總磷,耗氧量,透明度和總氮4種指針對湖泊水質富營養化所起作用。

由上可知個指標的作用很接近,比較而言總磷所起作用最大,耗氧量,總氮次之,透明度的額作用最小。其權重的順序和上面模型一樣,只是每個指標的權重略有差別。

二.用馬氏距離求解:測定湖泊水質的等級

(有點不懂,不懂意思)

八、 附錄:用matlab程式設計

x=[130 10.3 0.35 2.

76;105 10.7 0.4 2.

0;20 1.4 4.5 0.

22;30 6.26 0.25 1.

67;20 10.13 0.5 0.

23];

%輸入實測資料矩陣

a1=x(:,1)./max(x(:,1));a2=x(:,2)./ max(x(:,2));a3= min(x(:,3))./x(:,3);

a4=x(:,4)./ max(x(:,4));a=[a1,a2,a3,a4];%輸出用線性比例變換的標準化的實測矩陣

y=[1 4 23 110 660;0.09 0.36 1.

8 7.10 27.1;37 12 2.

4 0.55 0.17;0.

02 0.06 0.31 1.

20 4.60];

%輸入等級標準矩陣

b1=y(1,:)./ max(y(1,:));b2=y(2,:)./ max(y(2,:));b3= min(y(3,:))./y(3,:);

模糊聚類分析方法作業

模糊聚類分析的原理就是運用模糊等價關係進行分類的一種分析方法。將代分事物的全體作為論域,設論域為被分類物件,每個物件又有個指標表示其性狀,即 於是,得到原始資料矩陣為 其中表示第個分類物件的第個指標的原始資料。模糊聚類分析的實質就是按照莫衷標準鑑別事物之間的接近程度,把彼此接近的事物歸為一類。模糊聚...

模糊動態聚類分析

定義函式 模糊統計,m0劃分區間個數 n,m size a 獲得矩陣的行列數 amin a 1,1 a的最小值 amax a 1,2 a的最大值 for i 1 n if a i,1 a i,2 x a i,2 a i,2 a i,1 a i,1 x end a的最小值 if a i,1 if a ...

聚類分析及MATLAB應用

聚類分析 人類認識世界往往首先將被認識的物件進行分類,聚類分析是研究分類問題的多元資料分析方法,是數值分類學中的一支。多元資料形成資料矩陣,見下表1。在資料矩陣中,共有n個樣品 x1,x2,xn 列向 p個指標 行向 聚類分析有兩種型別 按樣品聚類或按變數 指標 聚類。表1 資料矩陣 聚類分析的基本...