一、算數平均數:某一總體值總體單位平均所得的標誌值的水平,是反映集中趨勢最常用、最基本的平均指標。
二、中位數:把總體單位某一數量標誌的各個數值按大小順序排列,位於正中處的變數值。
三、平均差:各變數值對其算術平均數(或中位數)離差絕對值的算術平均數。
四、標準差:各變數值對其算術平均數的離差平方的算數平均數的算數平方根,又稱均方差。
五、方差:為標準差的平方。
六、眾數:出現次數最多的變數值。用mo表示。眾數也是常用的反映現象集中趨勢的代表性數值.
七、在社會統計中,表達相關關係的強弱,削減誤差比例的概念是非常有價值的。削減誤差比例的原理是,如果兩變數間存在著一定的關聯性,那麼知道這種關聯性,必然有助於我們通過乙個變數去**另一變數。其中關係密切者,在由一變數**另一變數時,盲目性必然較關係不密切者為小。
八、皮爾遜相關係數:對於定距變數,根據其變數值的數學特徵,我們自然可以引進更為精確的量化指標來反映它們之間的關程度。用來測量兩個定距變數相關程度和方向的積差係數。
它是由英國統計學家皮爾遜(pearson)用積差方法推導出來,所以也稱皮爾遜相關係數,用符號r表示。
九、一元回歸分析:關於x為自變數、y為不確定的因變數的變數關係,其中只包括乙個自變數和乙個因變數,且二者的關係可用一條直線近似表示的回歸分析。
十、中心極限定理:從任意乙個總體中抽採樣本量為n的樣本,當n充分大時(在社會現象中,指n≥50),樣本均值的抽樣分布近似服從正態分佈。
十一、p 值(顯著度):1.是乙個概率值
2.如果原假設為真,p-值是抽樣分布中大於或小於樣本統計量的概率
3.被稱為觀察到的(或實測的)顯著性水平
h0 能被拒絕的最小值
十二、置信水平:總體引數值落在樣本統計值某一區間的概率,也稱置信度
正態分佈
1.由c.f.高斯(carl friedrich gauss,1777—1855)作為描述誤差相對頻數分布的模型而提出
2.描述連續型隨機變數的最重要的分布,許多現象都可以由正態分佈來描述
3.可用於近似離散型隨機變數的分布
例如: 二項分布
4.經典統計推斷的基礎
原假設: 待檢驗的假設,又稱「0假設」
備擇假設:與原假設對立的假設,又稱研究假設
十三、否定域:不大可能出現的結果
十四、異眾比率:非眾數的頻數與總體單位數的比值
十五、總體引數值:關於總體中某一變數的綜合描述,或者說是總體中所有元素的某種特徵的綜合數量表現。
十六、樣本統計值:關於樣本中某一變數的綜合描述,或者說是樣本中所有元素的某種特徵的綜合數量表。
十七、z分數:原始資料與均值之間的大小,實際表達變數值距算術平均數有幾個標準差。
十八、均值的標準誤差:是樣本均值的標準差,衡量的是樣本均值的離散程度。而在實際的抽樣中習慣用樣本均值來推斷總體均值,那麼樣本均值的離散程度(標準誤) 越大,抽樣誤差就越大。
所以用樣本均值的標準誤來衡量抽樣誤差的大小。
十九、斯皮爾曼相關係數:主要用於解決稱名資料和順序資料相關的問題。適用於兩列變數,而且具有等級變數性質具有線性關係的資料。
由英國心理學家、統計學家斯皮爾曼根據積差相關的概念推導而來,一些人把斯皮爾曼等級相關看做積差相關的特殊形式。
二十、置信水平與置信區間的關係:
置信水平:總體引數值落在樣本統計值某一區間的概率,也稱置信度,或者說,總體引數值落在樣本統計值某一區間的把握性程度。它反映的是綽約那個的可靠性程度。
置信區間:在一定的置信度下,樣本值與總體值之間的誤差範圍。它所反映的是抽樣的精確性程度。
二十一、區間估計與假設檢驗的關係:
1、 區間估計立足於大概率,用已知樣本統計量和標準誤差,確定乙個有概率意義的區間(置信區間),可理解為正向求解問題。
2、假設檢驗立足於小概率,利用反證法原理,首先依據兩種可能性建立兩種假設,再從第一種假設出發,計算出特定統計量,判斷該種假設是否成立。
3、聯絡:區間估計和假設檢驗可以看作同乙個問題的不同表達方式。區間估計和假設檢驗都是根據樣本資訊對總體引數進行推斷,都是以抽樣分布為理論依據,都是建立在概率基礎上的推斷,使用同一樣本、同一統計量、同一分布,二者可以相互轉換。
二十二、假設檢驗的理論基礎: 採用邏輯上的反證法;依據統計上的小概率原理
假設檢驗的基本步驟:
(1)、建立虛無假設和研究假設,通常是將原假設作為
(2)、根據需要選擇適當的顯著性水平
(3)、根據樣本資料計算出統計值,並根據顯著性水平查處對應的臨界值。
(4)、將臨界值與統計值進行比較,若臨界值大於統計值的絕對值,則接受虛無假設;反之,則接受研究假設。
二十三、中心極限定理的重要性:中心極限定理對大樣本均值正態分佈性質的揭示,為未知總體的研究奠定了理論基礎。
二十四、標準差與標準誤差的區別:1、標準差是樣本資料方差的平方根,它衡量的是樣本資料的離散程度;2、標準誤差是樣本均值的標準差,衡量的是樣本均值的離散程度。
二十五、置信水平與置信區間的關係:1、置信水平表示總體引數值落在樣本統計值某一區間的概率,也稱置信度。用(1-α)表示。
2、置信區間指在一定的置信度下,樣本值與總體值之間的誤差範圍,反映抽樣的精確程度。 使用乙個較大的置信水平會得到乙個比較寬的置信區間,而使用乙個較小的置信水平則會得到乙個較準確(較窄)的區間。
當置信水平1-α=0.90時,zα/2=1.65;1-α=0.95時,zα/2=1.96;1-α=0.99,zα/2=2.58
二十六、相關關係與因果關係的聯絡與區別:
區別:1、相關關係是指兩個以上的變數的樣本觀測值序列之間表現出來的隨機數學關係,用相關係數來衡量。2、因果關係是指兩個或兩個以上變數在行為機制上的依賴性,結果變數由原因變數決定,原因變數的變化會引起結果變數的變化。
有單向因果關係和互為因果關係之分。
聯絡:具有因果關係的變數一定具有數學上的相關關係,而具有相關關係的變數不一定有因果關係。
二十七、公式:
1、皮爾遜相關係數:
2、回歸方程:
3、置信區間相關公式(雙側檢驗):
(1)、對於大樣本的總體均值在1-α置信水平下的置信區間為:
σ為總體標準差,s為樣本標準差,當σ未知,用s來替代。
(2)、對於小樣本且σ未知時:
(3)、總體比例在1-α 置信水平下的置信區間為
(4)、在抽樣分布中:
1、z作為檢驗大樣本統計量,σ未知時:
2、t作為小樣本檢驗統計量時,σ未知:
當計算的z值或t值等於或大於顯著性水平下的z值和t值,那麼否定零假設。
統計學總結
單選20 1 20 簡答題3 5 15 計算題65 第一章導論 一什麼是統計 包括統計研究的主要內容 統計學是一門收集 整理 顯示和分析統計資料的科學 二與其他學科有什麼關係 數學,工商 1統計學與數學都是研究數量規律的,都要利用各種公式進行運算。數學中的概率論,為統計學提供了數量分析的理論基礎。統...
統計學總結
對稱分布 特別是正態分佈 均數標準差結合起來從平均水平和變異程度兩方面描述變數的分布特徵.偏態分布 中位數四分位數間距結合起來從平均水平和變異程度兩方面描述變數的分布特徵.第3章定性變數的統計描述 1.絕對數 定性資料整理中,根據資料的類別直接清點各組所得的資料,反映事物的實際水平,也是統計分析的基...
統計學概念總結
1.統計學 收集 處理 分析 解釋資料並從資料中得出結論的科學。2.描述統計 研究資料收集 處理和描述的統計學分支。3.推斷統計 研究如何利用樣本資料來推斷總體特徵的統計學分支。4.分類資料 只能歸於某一類別的非數字型資料。5.順序資料 只能歸於某一有序類別的非數字型資料。6.數值型資料 按數字尺度...