實驗一資料預處理上機實習
1、實驗目的
通過完成資料統計和預處理程式的設計和實現及完成算例,掌握統計一組資料的極值、均值、方差、變異係數及進行資料預處理的方法。
二、實驗內容:建立原始資料檔案、鑑別並剔除異常值、得出樣本的統計特徵。
三、實驗步驟:
1、 開啟地學資訊系統。
2、 檔案操作——新建原始資料檔案——輸入原始資料(按照格式)
3、 檔案操作——儲存原始資料檔案(注意檔名和檔案儲存地點)
4、 預處理與統計——資料管理
5、 「開始計算嗎?」——確定
6、 「請選擇(a-q)」——a、資料預處理
7、 「請選擇(a-d)」——a、鑑別並剔除異常值
8、 「剔除第幾個變數的異常值?」——從1~9逐個進行
9、 「請選擇異常值剔除準則(1-2)?」——1、4-sigma準則
10、「要剔除嗎(y/n)?」——n
11、「繼續地質資料預處理(y/n)」——y(會重複出現6以後的步驟,在第8步中輸
入1~9,逐個進行處理)
12、最後乙個「繼續地質資料預處理(y/n)」——n
13、「請選擇(a-q)」——q、返回
14、檔案操作——儲存計算結果(注意提供檔名和檔案儲存地點)
15、預處理與統計——統計特徵
16、「開始計算嗎?」——確定
17、「統計第幾個變數的特徵值?」——從1~9逐個進行
18、「進行正態分佈檢驗嗎(y/n)?」——n
19、檔案操作——儲存計算結果(注意提供檔名和檔案儲存地點)
四、例項結果
1、原始資料檔案
15,9
1,1.766115,3.481379,52.62,5.70,15.27,9.95,5.82,9.60,1158
2,1.728760,3.234192,52.52,2.20,38.92,2.40,1.04,1.40,1578
3,1.715418,3.682390,61.10,5.20,23.35,2.78,2.86,1.36,1372
4,1.459392,3.982461,30.36,33.59,28.21,3.09,0.89,1.58,1383
5,1.738305,3.505710,71.90,4.00,14.59,2.33,1.04,1.55,1285
6,1.713323,3.293934,53.58,1.80,37.84,3.23,1.09,1.80,1564
7,1.751741,3.482815,66.16,4.00,18.59,4.46,1.38,1.61,1320
8,1.853637,3.461214,64.26,5.90,14.27,5.56,2.27,3.98,1230
9,1.649627,3.773592,55.80,7.80,23.89,4.19,3.11,2.23,1350
10,1.720903,3.392639,51.70,2.60,37.19,3.36,2.44,1.00,1549
11,1.737908,3.471311,59.20,3.70,30.48,2.75,1.18,0.94,1479
12,1.631849,3.824918,56.12,10.50,17.3,8.37,2.07,4.90,1233
13,1.720407,3.292416,56.06,4.60,36.00,1.17,1.23,0.31,1555
14,1.828789,3.497142,72.88,6.05,14.49,3.09,1.04,1.28,1290
15,1.709948,3.675595,67.90,5.40,15.84,4.39,2.96,2.19,1282
2、結果資料檔案
鑑別並剔除異常值:
計算均值和標準差:
ax( 1)= 1.715075 s( 1)= 9.024319e-02
ax( 2)= 3.53678 s( 2)= .2117575
ax( 3)= 58.144 s( 3)= 10.43159
ax( 4)= 6.869333 s( 4)= 7.715266
ax( 5)= 24.41533 s( 5)= 9.562974
ax( 6)= 4.074667 s( 6)= 2.334777
ax( 7)= 2.028 s( 7)= 1.315296
ax( 8)= 2.382 s( 8)= 2.311914
ax( 9)= 1375.2 s( 9)= 137.9431
使第 1列元素公升序排列:
據 4-sigma 準則
資料左端無異常值 !
資料右端無異常值 !
使第 3列元素公升序排列:
據 4-sigma 準則
資料左端無異常值 !
資料右端無異常值 !
使第 5列元素公升序排列:
據 4-sigma 準則
資料左端無異常值 !
資料右端無異常值 !
使第 7列元素公升序排列:
據 4-sigma 準則
資料左端無異常值 !
資料右端無異常值 !
使第 2列元素公升序排列:
據 4-sigma 準則
資料左端無異常值 !
資料右端無異常值 !
使第 4列元素公升序排列:
據 4-sigma 準則
資料左端無異常值 !
資料右端無異常值 !
使第 6列元素公升序排列:
據 4-sigma 準則
資料左端無異常值 !
資料右端無異常值 !
使第 8列元素公升序排列:
據 4-sigma 準則
資料左端無異常值 !
資料右端無異常值 !
使第 9列元素公升序排列:
據 4-sigma 準則
資料左端無異常值 !
資料右端無異常值 !
-1-最大值: 1.854
最小值: 1.459
極差: .394
算術平均值: 1.715
標準差: .09
變異係數: .053
-4-最大值: 33.59
最小值: 1.8
極差: 31.79
算術平均值: 6.869
標準差: 7.715
變異係數: 1.123
-7-最大值: 5.82
最小值: .89
極差: 4.93
算術平均值: 2.028
標準差: 1.315
變異係數: .649
-2-最大值: 3.982
最小值: 3.234
極差: .748
算術平均值: 3.537
標準差: .212
變異係數: .06
-5-最大值: 38.92
最小值: 14.27
極差: 24.65
算術平均值: 24.415
標準差: 9.563
變異係數: .392
-8-最大值: 9.6
最小值: .31
極差: 9.29
算術平均值: 2.382
標準差: 2.312
變異係數: .971
-3-最大值: 72.88
最小值: 30.36
極差: 42.52
算術平均值: 58.144
標準差: 10.432
變異係數: .179
-6-最大值: 9.95
最小值: 1.17
極差: 8.78
算術平均值: 4.075
標準差: 2.335
變異係數: .573
-9-最大值: 1578.
最小值: 1158.
極差: 420.
算術平均值: 1375.2
標準差: 137.944
變異係數: .1
3、對結果資料進行解釋
此題目中有9個變數、15個樣本,9個變數均無異常值。
計算機地質學上機實習報告
一 實驗目的 通過對兩類判別分析程式設計及完成算例,掌握兩類判別分析基本原理和方法。二 實驗內容 建立原始資料檔案 通過二類分析得到結果資料 得出樣本的統計特徵。三 實驗步驟 1 開啟地學資訊系統。2 檔案操作 新建原始資料檔案 輸入原始資料 按照格式 3 檔案操作 儲存原始資料檔案 注意檔名和檔案...
油氣田開發地質學上機實習報告一
開發儲層評價 姓名王仲 學號 200911010219 班級勘探0902 指導老師王建民 日期 2012 4 27 一 孔隙度 滲透率分析。1.上圖為分別為孔隙度和滲透率的頻率及累計頻率分布圖。孔隙度主要分布區間在12 14 之間,其次是在10 12 之間。孔隙度分布較為均勻,孔隙度中等。滲透率主要...
計算機上機實習
一 實習目的 上機實習是在學生已經學習了部分專業課以後進行的,是理論與實際相結合的重要環節。專業實習對於學生綜合素質的提高具有重要意義。專業實習的目的是提高學生的動手能力和綜合實踐能力,提高學生的學習興趣,為提高學生的就業競爭打好基礎。更好的掌握電腦的應用。二 實習時間 2011 6 20 2011...