聚類分析實驗指導書 R

2023-01-25 01:39:02 字數 1188 閱讀 4274

實驗報告

院 (部): 管理工程學院

專業:資訊管理與資訊系統

實驗專案: 聚類分析

班級: 信管111

姓名: 戴有金

學號: 2011021635

聚類分析實驗指導書

實驗目的:

1熟悉r語言的相關物件與函式的用法

2掌握利用r進行聚類分析的基本步驟

實驗內容:

說明:本實驗採用iris資料集,下面中的資料集如無上下文說明,即是指iris

iris以鳶尾花的特徵作為資料**,資料集包含150個資料集,分為3類,每類50個資料,每個資料報含4個屬性,是在資料探勘、資料分類中非常常用的測試集、訓練集。

四個屬性分別為:花萼長度、花萼寬頻、花瓣長度、花瓣寬度

三類分別為:setosa, versicolor, virginica(山鳶尾、變色鳶尾和維吉尼亞鳶尾)

1對資料集進行初步的統計與分析

(1) 資料集的維度-dim

(2) 資料集中的列名-names

(3) 資料集的內部結構-str

(4) 資料集的屬性-attributes

(5) 檢視資料集的前五條資料情況

(6) 檢視資料集中屬性前10行資料

(7) 顯示資料集中每個變數的分布情況-summary

(8) 資料集列species中各個值出現頻次

(9) 根據列species畫出餅圖-pie

(10) 算出列的所有值的方差-var

(11) 算出列iris$和iris$的協方差-cov

(12) 算出列iris$和iris$的相關係數-cor

(13) 畫出列iris$分布柱狀圖

(14) 畫出列iris$的密度函式圖

(15) 畫出列iris$和iris$的散點圖

(16) 繪出矩陣各列的散布圖-plot

plot(iris)或者pairs(iris)

2使用knn包進行kmean聚類分析

(1) 將資料集進行備份newiris<-iris,將列newiris$species置為空newiris$species<-null,將此資料集作為測試資料集

如圖所示,已經將species置空了。

(2) 在資料集newiris上執行kmean聚類分析, 將聚類結果儲存在kc中。在kmean函式中,將需要生成聚類數設定為3(kmeans(newiris,3))

決策樹實驗指導書R

實驗目的 1掌握利用r進行決策樹的基本步驟 2更深入理解決策樹的應用 實驗內容 說明 本實驗採用iris資料集,下面中的資料集如無上下文說明,即是指iris iris以鳶尾花的特徵作為資料 資料集包含150個資料集,分為3類,每類50個資料,每個資料報含4個屬性,是在資料探勘 資料分類中非常常用的測...

空間分析實驗指導書

1.實驗目的 1 熟悉常用空間分析方法及其底層實現 2 能自己程式設計實現某些空間分析演算法 3 能利用已有的空間分析演算法與gis結合解決實際問題 2.實驗內容 本課程實驗以掌握空間分析常用演算法為主要內容,包括 1 利用程式語言實現某些常用的空間分析演算法 2 能熟練使用某些軟體提供的空間分析功...

儀器分析實驗指導書

酒中甲醇含量的測定,以氫火焰離子化檢測器利用醇類物質在氫火焰中的化學電離進行檢測,根據甲醇的色譜峰高與標準曲線比較進行定量。實驗內容 1 儀器與試劑 1 儀器 帶程式公升溫的氣相色譜儀,配置氫焰檢測器,化學工作站,色譜柱rxt wax 30m x 0 25 mm x 0 25 mm 或其他中強極性毛...