第一節集中趨勢的描述
變數分布特徵可以從以下三個方面加以描述:
集中趨勢:反映變數分布中各變數值向中心值靠攏的程度;
離中趨勢:反映變數分布中各變數值遠離中心值的程度;
分布形狀:反映變數分布的偏斜程度和尖陡程度。
一、集中趨勢與平均指標
集中趨勢亦稱為趨中性,是指變數分布以某一數值為中心的傾向。用平均指標來反映。
平均指標的種類
數值平均數包括
算術平均數:簡單算術平均加權算術平均
調和平均數:簡單調和平均加權調和平均
幾何平均數:簡單幾和平均加權幾和平均
位置平均數包括:眾數中位數分位數
平均指標的作用(自學)
二、數值平均數
(一)算術平均數
1、基本計算公式:總體標誌總量/總體單位總數
2、簡單算術平均數:
1)計算公式:
(2)適用範圍:末分組資料。
3、加權算術平均數:
(1)計算公式:
(2)說明:
在組距數列中x用組中值 ;影響因素:標誌值、權數。
(3)適用範圍:分組資料中已知分母加總資料。
(4)注意問題——權數及權數的作用。
4、算術平均數的數學性質
5、算術平均數的優缺點: 優點: a.)可推算總體標誌總量;
b.)便於代數運算;
c.)抽樣中具有良好穩定性。
缺點:a.)受極端值的影響大;
b.)組距數列中有較大假設性。
(二)調和平均數
1.問題的提出
例:市場上蘋果的**有三種:3元/斤;2.4元/斤;1.2元/斤,現有兩種可供選擇的方案:甲各買30元或乙各買15斤,問選擇何方案為優?
2.調和平均數的概念
(1)概念:標誌值倒數的算術平均數的倒數。
(2)特點:a.)常作為算術平均數的變形
b.)標誌值中有資料為零時無法計算。
(3)簡單調和平均數
適用範圍:末分組資料。
(4)加權調和平均數
實質:加權算術平均數的變形。
適用範圍:分組資料已知基本公式分子加總資料。
(三)由相對數或平均數計算平均數
基本步驟:1.)寫出基本公式;
2.)確定計算公式;
3.)具體計算。
(四)幾和平均數
1、簡單幾和平均數
適用範圍:資料末分組,變數值互相影響。
2、加權幾和平均數
適用範圍:分組資料,變數值互相影響。
(五)算術平均數、調和平均數、幾和平均數的數學關係
同一資料計算結果:x≥g≥h
三、位置平均數
(一)中位數
1、中位數的概念:總體單位按某一標誌值排隊後中間位置的標誌值。
2、中位數的計算
(1)末分組資料中位數的計算
基本步驟:1.)將總體單位按某一標誌進行排隊 ;
2.)確定中數的位置:(n+1)/2
3.)中間位置上的那個標誌值即為中位數。
(2)分組資料中位數的計算
基本步驟:1.)計算累計頻數(向上累計頻數或向下累計頻數);
2.)確定中位數的位置:∑f/2
3.) 單項數列:該組的標誌值即為中位數 ;
組距數列,根據上下限公式計算中位數。
(3)中位數的特點(自學)
(二)分位數
1、概念
將變數的數值按大小順序排列並等分為若干部分後,處於等分點位置的數值。常用的分位數有四分位數、十分位數和百分位數。
,和分別表示第乙個、第二個和第三個四分位數,則他們的位置分別為:,和,根據位置即可確定各個四分位數。
(三)眾數
1、眾數的概念:變數中出現次數最多的變數值。
2、末分組資料眾數的計算:直接根據眾數概念(單項數列同)。
3、分組資料眾數的計算:
a.)確定眾陣列;
b.)根據上下限公式計算眾數的具體數值。
4.眾數的特點(自學)
(四)中位數、眾數、算術平均數的關係
第二節離中趨勢的描述
一、離中趨勢和離散指標
所謂離中趨勢,就是變數分布中各變數值背離中心值的傾向。用離散指標來反映。
常用的離散指標主要有:全距(亦稱極差)、四分位差、異眾比率、平均差、標準差、離散係數等。
二、離散指標的測度
(一)全距
1、概念:總體各單位標誌值中最大標誌值與最小標誌值之差。
=-2、特點: 受極端值影響最大。
(二)四分位差
四分位差是四分位數中第乙個四分位數與第三個四分位數之差,也稱為內距或四分間距,通常用表示,即:
通常與中位數相結合,用以表明變數分布中間50%數值的離散程度,
(三)異眾比率
異眾比率是分布數列中非眾陣列的頻數與總頻數之比,通常用來表示,即:
其中為眾陣列的頻數。
通常與眾數相結合,用以表明眾數代表性的高低。
(四)平均差
1、概念:總體各單位標誌值與其算術平均數的離差絕對值的算術平均數。
2、平均差的計算:
優點:利用了全部資料資訊,能比較客觀反映變數分布的離散程度。
不足:取了絕對值,因而數學處理不是很方便,數學性質也不是最優,應用上受到了一些限制。
(五)方差和標準差
1、概念
方差是變數的各變數值與其均值的離差平方的算術平均數,標準差則是方差的平方根。方差和標準差是測度變數分布離散程度最重要的指標。
2、方差的計算公式為:
(根據未分組資料)
(根據變數數列)
標準差的計算公式為:
(根據未分組資料)
(根據變數數列)
優點:方差和標準差利用了全部資料資訊,因而能準確反映變數分布的離散程度。尤其是標準差與平均差相比,不僅具有平均差的優點,而且彌補了平均差的不足,再加上標準差的計量單位與變數相同,意義比方差明確,所以標準差在實踐中得到了廣泛的應用。
說明:一是根據組距式數列計算的方差和標準差只是乙個近似值;二是在根據樣本資料(甚至是有限總體資料)計算方差和標準差時,分母應該是(),但當很大時,可以忽略與之間的區別。
3、方差和標準差的性質
(1)常數的方差為0。
(2)若,為常數,則的方差與的方差之間的關係為:
(3)標準差是計算標準化值的依據。假設變數的標準化統計量用表示,標準化值用表示,則
服從均值為0、標準差為1的標準正態分佈。也叫標準得分或標準統計值。
(六)離散係數
為了不同變數分布之間離散程度的可比性,就必須消除不同均值水平和不同計量單位的影響,就應該計算相對離散指標。
相對離散指標也叫離散係數變異係數或標準差係數,是變數的標準差與均值之比,通常用來表示,即:
離散係數越大,說明變數分布的離散程度越強,平均數的代表性越差。
三、是非標誌的平均數和標準差
1、是非標誌的概念:品質標誌中能用1或0進行描述的標誌。
2、成數:總體中標誌值為1或標誌值為0 的單位數(n1和n0)佔總體單位總數(n)的比重,用p或q表示。
其中: p=n1/n ; q=n0/n ; p+q=1
3、是非標誌的平均數:是非標誌的平均數=p
4、是非標誌的標準差
第三節分布形狀的描述
一、分布形狀和形狀指標
變數分布的形狀要用形狀指標來反映。形狀指標就是反映變數分布具體形狀,即左右是否對稱、偏斜程度與陡峭程度如何的指標。
反映變數分布偏斜程度的指標,稱為偏度係數;
反映變數分布陡峭程度的指標,稱為峰度係數。
二、偏度係數
偏度指變數分布偏斜的方向及其程度。偏度係數來實現的,通常用來表示。
偏度係數的計算主要有以下三種方法:
1、利用算術平均數與眾數或中位數的離差計算=
2、利用四分位數計算=
3、利用動差法計算
三、峰度係數
1、概念
峰度通常是指鍾型分布的頂峰與標準正態分佈相比偏扁平或偏尖陡的程度。分為三種情況:標準正態峰度、尖頂峰度和平頂峰度。
峰度係數通常用來表示。
2、峰度係數的計算
主要採用動差法 ,當=3時,變數分布的峰度為標準正態峰度;當<3時,變數分布的峰度為平頂峰度;當》3時,變數分布的峰度為尖頂峰度。
如何描述地理事物的空間分布特徵
一 點狀地理事物的描述 試題通常以某一區域圖為背景圖來呈現點狀事物的分布狀況,在讀圖時要注意從點的大小 疏密 組成的形狀來觀察點狀事物代表的含義。描述的角度 疏密 數量 極值 方位。具體描述 總體分布特徵 疏密狀況,是否均衡 如果不均,哪多,哪少 極值區位置名稱 最多 最少 最集中的地帶在哪,沿什麼...
第四章資料分布特徵的描述
第一節資料分布的集中趨勢 一 描述分布集中趨勢的主要指標及其作用 1 描述分布集中趨勢的主要指標 平均數 眾數 中位數 2 作用 1 反映總體各單位變數分布的集中趨勢和一般水平 2 便於比較同類現象在不同單位間的發展水平 3 能夠比較同類現象在不同時期的發展變化趨勢或規律 4 分析現象之間的依存關係...
第3章資料分布特徵的統計描述習題
1 有n輛汽車在同一距離的公路上行駛的速度資料,確定汽車平均每小時行駛速度的平均數公式是 c ab c d 2 權數對加權算術平均數的影響,取決於 b a.權數所在組標誌值的大小 b.權數的大小 c.各組單位數的多少d.總體單位數的多少 3 2.是非標誌不存在變異時,意味著 b,c a.各標誌值遇到...