應用多元統計分析應用報告

2023-02-09 15:57:04 字數 2386 閱讀 8375

課程報告

班級專業:_ 市調0901 _

學號: 2009***** __

姓名:__ cyq _____

成績2023年10月7日

我國部分城市主要經濟指標統計

官方與民間資料差異分析

一、引言

經濟指標是反映一定社會經濟現象數量方面的名稱及其數值。本題主要經濟指標包括人均gdp(元)、人均工業產值(元)、客運總量(萬人)、貨運總量(萬噸)、(億元)、固定資產投資總額(億元)、在崗職工佔總人口的比例(%)、在崗職工人均工資額(元)、城鄉居民年底儲蓄餘額(億元)。所以我們借助這一指標體系對我國部分城市的主要經濟指標進行分析。

二、資料分析

過程1. 在spss視窗中選擇analyze→classify→hierachical cluster,調出系統聚類分析主介面,並將變數x1~x5移入variables框中。在cluster欄中選擇cases單選按鈕,即對樣品進行聚類(若選擇variables,則對變數進行聚類)。

在display欄中選擇statistics和plots核取方塊,這樣在結果輸出視窗中可以同時得到聚類結果統計量和統計圖。

2. 點選statistics按鈕,設定在結果輸出視窗中給出的聚類分析統計量。這裡我們選擇系統預設值,點選continue按鈕,返回主介面。

3. 點選plots按鈕,設定結果輸出視窗中給出的聚類分析統計圖。選中dendrogram核取方塊和icicle欄中的none單選按鈕,即只給出聚類樹形圖,而不給出冰柱圖。

單擊continue按鈕,返回主介面。

4. 點選method按鈕,設定系統聚類的方法選項。這裡我們仍然均沿用系統預設選項。單擊continue按鈕,返回主介面。

5. 點選s**e按鈕,指定儲存在資料檔案中的用於表明聚類結果的新變數。none表示不儲存任何新變數;single solution表示生成乙個分類變數,在其後的矩形框中輸入要分成的類數;range of solutions表示生成多個分類變數。

這裡我們選擇range of solutions,並在後面的兩個矩形框中分別輸入2和4,即生成三個新的分類變數,分別表明將樣品分為2類、3類和4類時的聚類結果。點選continue,返回主介面。

6. 點選ok按鈕,執行系統聚類過程

從上面的樹狀圖可以直接的觀察到,如果用聚類分析將這些地區分為三類,則24深圳獨自為一類,10上海和16廈門為一類,剩下的城市為一類。

三,k值聚類分析

過程1. 在spss視窗中選擇analyze→classify→k-means cluster,調出k均值聚類分析主介面,並將變數—移入variables框中,將標誌變數region移入label case by框中。在method框中選擇iterate classify,即使用k-means演算法不斷計算新的類中心,並替換舊的類中心(若選擇classify only,則根據初始類中心進行聚類,在聚類過程中不改變類中心)。

如果不手工設定,則系統會自動設定初始類中心,這裡我們不作設定。

2. 1. 在spss視窗中選擇analyze→classify→k-means cluster,調出k均值聚類分析主介面,並將變數—移入variables框中,將標誌變數region移入label case by框中。

在method框中選擇iterate classify,即使用k-means演算法不斷計算新的類中心,並替換舊的類中心(若選擇classify only,則根據初始類中心進行聚類,在聚類過程中不改變類中心)。如果不手工設定,則系統會自動設定初始類中心,這裡我們不作設定。

3. 點選s**e按鈕,設定儲存在資料檔案中的表明聚類結果的新變數。其中cluster membership選項用於建立乙個代表聚類結果的變數,預設變數名為qcl_1;distance from cluster center選項建立乙個新變數,代表各觀測量與其所屬類中心的歐氏距離。

我們將兩個核取方塊都選中,單擊continue按鈕返回。

4. 點選options按鈕,指定要計算的統計量。選中initial cluster centers和cluster information for each case核取方塊。

這樣,在輸出視窗中將給出聚類的初始類中心和每個觀測量的分類資訊,包括分配到哪一類和該觀測量距所屬類中心的距離。單擊continue返回。

5. 點選ok按鈕,執行k均值聚類分析程式

2. k值聚類分析

(1)給出初始類中心

給出每次迭代結束後類中心的變動。由圖看出本次類聚過程共經歷了三次迭代

給出各觀測量所屬的類及所屬中心的距離。

用k值聚類分析可以把這些城市被分為3類。第一類包括:深圳。

第一類城市人均gdp和人均工業產值較高,屬於較發達地區。第二類包括:北京,天津,上海,南京,杭州,寧夏,廈門,青島,廣州,南京,海口。

這些地區的人均gdp和人均工業產值屬於三類中居中的位置,屬於中等發達地區。剩下的城市被分為第三類,它們的各種資料顯示,都表明它們屬於欠發達地區。

應用多元統計分析實驗報告之主成分分析

本次實驗的研究目的是根據這些指標用主成分分析法對各地區城市設施水平進行綜合評價和排序,得出結論並提出建議。二 研究過程 從標準化資料出發,首先計算這些指標的主成分,然後通過主成分的大小進行排序。1.利用spss進行因子分析 表2和表3分別是特徵根 方差貢獻率 和因子載荷陣的資訊。表2 特徵根和方差貢...

多元統計分析方法

多元統計分析概述 目錄一 引言3 二 多元統計分析方法的研究物件和主要內容 3 1.多元統計分析方法的研究物件3 2.多元統計分析方法的主要內容3 三 各種多元統計分析方法3 1.回歸分析3 2.判別分析6 3.聚類分析8 4.主成分分析10 5.因子分析10 6.對應分析方法11 7.典型相關分析...

應用多元統計分析報告習的題目解答 因子分析報告

第七章因子分析 7.1 試述因子分析與主成分分析的聯絡與區別。答 因子分析與主成分分析的聯絡是 兩種分析方法都是一種降維 簡化資料的技術。兩種分析的求解過程是類似的,都是從乙個協方差陣出發,利用特徵值 特徵向量求解。因子分析可以說是主成分分析的姐妹篇,將主成分分析向前推進一步便導致因子分析。因子分析...