統計學總結

2021-12-26 03:51:08 字數 5169 閱讀 5705

單選20*1=20 簡答題3*5=15 計算題65

第一章導論

一什麼是統計(包括統計研究的主要內容)

統計學是一門收集、整理、顯示和分析統計資料的科學

二與其他學科有什麼關係(數學,工商)

1統計學與數學都是研究數量規律的,都要利用各種公式進行運算。數學中的概率論,為統計學提供了數量分析的理論基礎。統計學中的理論統計學以抽象的數量為研究物件,其大部分內容也可以看作是數學的分支。

區別從研究物件看,數學以最一般的形式研究數量的聯絡和空間形式。統計學特別是應用統計學則總是與客觀的物件聯絡在一起的。

從研究方法看,數學主要是邏輯推理和演繹論證的方法。而統計本質上是歸納的方法。統計學家特別是應用統計學家需要深入實際,進行調查或實驗去取得資料,研究時不僅要運用統計的方法,而且還要掌握某一專門領域的知識。

三基本概念

1什麼叫總體,單位

統計總體/總體:是根據一定目的確定的所要研究

總體單位/單位:是組成總體的各個個體。

2資料的型別(定性,定量)

定性資料/品質資料:

說明事物的品質特徵,是不能用數值表示的,其結果通常表現為類別,這類資料是由定類尺度和定序尺度計量形成的。

分類資料、順序資料

定量資料/數量資料/數值型資料

說明事物的數量特徵,是能夠用數值表示的,這類資料是由定距尺度和定比尺度計量形成的。

3什麼叫變數(連續,離散,二者區分是取小數點有沒有意義)

變數:說明現象某種特徵的概念。

連續變數和離散變數

連續變數:變數的取值在數軸上連續不斷,無法一一枚舉,即在乙個區間內可以取任意實數值。

離散變數是指變數的其取值是整數值,可以一一枚舉。

第二章統計資料的蒐集

如何蒐集分為直接和間接

間接又分為統計調查和統計實驗

統計調查又分為全面和非全面每個名詞定義

非全面又分為概率和非概率

1直接渠道:直接的統計調查或科學實驗

間接渠道:使用別人調查或實驗的資料

2統計調查:

根據統計研究預定的目的要求和任務,運用相應的科學的調查方法與手段,有計畫、有組織地向客觀實際蒐集數字資料的過程。通常運用於社會現象的調查

統計實驗:

在實驗中控制乙個或多個變數,在一定的控制條件下觀察實驗物件,在實過程中取得實驗資料的方法。通常運用於自然現象的調查

3全面調查

普查、全面統計報表制度

非全面調查/抽樣

概率抽樣、非概率抽樣

4概率抽樣

概念:概率抽樣是指遵循隨機原則進行的抽樣,總體中每個單位都有一定的機會被選入樣本。

非概率抽樣

概念:非概率抽樣是相對於概率抽樣而言的,指抽取樣本時不是依據隨機原則,而是根據研究目的對資料的要求,採用某種方式從總體中抽出部分單位對其實施調查

第三章統計資料的整理

一整理:預處理,統計分組,統計圖表

1)預處理

a資料的審核

一手資料:完整性審核、準確性審核

二手資料:適用性審核、時效性審核

b資料的篩選

c資料的排序資料透視表的應用

2)統計分組

概念:統計分組是根據統計研究的目的和客觀現象的內在特點,按某個標誌(或幾個標誌)把被研究的總體劃分為若干個不同性質的組的統計方法 。

原則:窮盡原則、互斥原則

種類:按分組標誌的多少:簡單分組、復合分組

按分組標誌的性質:品質分組、數量分組

a定性資料分組乙個取值乙個組——單項式分組

b定量資料分組

1、按離散變數分組

(1)變數值取值不多時:乙個取值乙個組——單項式分組

(2)變數值取值較多時,乙個區間乙個組 —— 組距式分組

2、按連續變數分組:乙個區間乙個組——組距式分組

組數經驗公式:m=1+3.3lg n

3資料整理的基本步驟:

1排序:2組數:3組距:

3) 統計表與統計圖

直方圖,累計次數分布圖

解題步驟適當統計分組 1判斷資料型別,選擇合適統計分組方法 2寫出統計分組的步驟 3在統計分組的基礎上,計算一下指標(頻數,頻率,組中值,累計頻數,累計頻率)4在統計分組上畫統計圖

第四章資料分布特徵的描述

一集中趨勢是指一組資料向某一中心靠攏的傾向,測度集中趨勢也就是尋找資料一般水平的代表值或中心值。(5個指標)

1眾數下限公式

2中位數四分位數第一步排序 ,然後套公式

3平均數

a什麼時候用幾何平均數當總比率等於各個比率連乘時,計算平均比率用幾何平均數

一般用於計算平均比率或平均速度值

b調和平均數沒分組用簡單調和平均數,

有分組用加權調和平均數

c加權算數平均數

二離散程度(8個指標)

異眾比率、極差/全距、分位差、平均差、方差、標準差、離散係數

離散係數什麼時候用,當兩個平均水平不同時

方差標準差套公式先判斷是全體資料還是抽樣的,然後在分組計算

總體標準差樣本標準差

總體方差樣本方差

三偏態與峰態(不要求計量)

各自概念,結果什麼意思

先判斷是全體資料還是抽樣的,然後在分組計算

偏態係數:測度分布偏斜方向和程度峰度係數:描述分布集中趨勢高峰的形狀

第五章抽樣與抽樣分布

一、總體指標與樣本指標

總體指標/總體引數:在抽樣估計中,用來反映總體數量特徵的指標。

總體平均數μ、總體比例p、總體標準差σ、總體方差σ2

樣本指標/樣本統計量/估計量:根據樣本資料計算的、用以估計和推斷相應總體指標的綜合指標。

樣本平均數 、樣本比例p、樣本標準差s、樣本方差s2

總體引數是唯一的,往往未知的;樣本統計量是不唯一的,隨著抽取的樣本的不同而不盡相同。

二、抽樣分布

(一)抽樣分布的概念

由樣本統計量的全部可能取值和與之相應的概率(頻率)組成的分配數列。

在實際應用中,統計量的抽樣分布是通過教學推導或在計算機上利用程式進行模擬而得到的。

二、抽樣分布的推導(以樣本均值為例)

例:設有四名學生參加知識題競猜,競猜成績分別為1分、2分、3分、4分。現從中抽取兩名學生構成樣本(重複抽樣),求樣本平均成績的抽樣分布。

分析:總體是什麼?總體均值等於多少?

總體容量?樣本容量?樣本個數?

計算各個樣本的均值?總體均值與樣本均值的區別?

樣本均值的概率分布?

樣本均值的抽樣分布的特點

抽樣分布的形式與原有總體的分布和樣本容量n的大小有關。

如果原有總體是正態分佈,那麼,無論樣本容量的大小,樣本均值的抽樣分布都服從正態分佈;

如果原有總體分布是非正態分佈,而樣本容量n≥30,則隨著樣本容量的增大,樣本均值的抽樣分布將趨於正態分佈;

如果原有總體分布是非正態分佈,而樣本容量n<30,則樣本均值的抽樣分布不是正態分佈。

三、常用統計量的抽樣分布

樣本統計量分為樣本均值,樣本比率,樣本方差

樣本均值,正態總體或非正態總體大樣本———正態分佈

非正態總體小樣本---------t分布

樣本比率,大樣本正態分佈

樣本方差2分布

總體分布與樣本統計量的抽樣分布之間不僅存在密切聯絡,總體引數與樣本統計量之間也存在密切聯絡。

第六章引數估計

一引數估計的步驟

1. 計算樣本指標

2. 計算抽樣平均誤差

3. 查表得統計量臨界值

4. 計算抽樣極限誤差

5. 計算置信區間

二雙總體引數的區間估計

一兩個總體均值之差的區間估計

a兩個獨立樣本b兩個匹配樣本

a大樣本大樣本

方差已知小樣本

方差未知

b小樣本(總體應正態分佈)

方差已知

方差未知但相等

方差未知但不相等

獨立大樣本

方差已知

方差未知

獨立小樣本、方差已知

獨立小樣本、方差未知

方差相等

方差不相等

兩個匹配樣本

大樣本小樣本:

二、兩個總體成數之差的區間估計

正態總體、獨立樣本

三、兩個總體方差比的區間估計

第七章假設檢驗

一、假設檢驗的步驟

1. 提出原假設和備擇假設;

2. 根據抽樣分布,計算樣本統計量;

3. 選擇顯著性水平α,查表確定臨界值;

4. 判斷並得出結論。

注意!總體方差未知時用t統計量:

但是,在大樣本場合,t-統計量與標準正態分佈統計量近似,通常用z檢驗代替t檢驗

某廠採用自動包裝機分裝產品,假定每包產品的重量服從正態分佈,每包標準重量為1000克。某日隨機抽查9包,測得樣本平均重量為986克,樣本標準差為24克。試問在0.

05的顯著性水平上,能否認為這天自動包裝機工作正常?

正態分佈、方差未知、小樣本

h0:μ=1000 h1:μ≠1000

α=0.05 查表得tα/2(n-1)=t0.025(8)=2.306

∵ |t|=1.75 < tα/2(n-1)= 2.306

∴ 接受原假設,拒絕備選假設,即可認為這天自動包裝機工作正常。

總體成數的假設檢驗

例:某企業宣告有30%以上的消費者對其產品質量滿意。如果隨機調查600名消費者,表示對該企業產品滿意的有220人。

試在顯著性水平α=0.05下,檢驗調查結果是否支援企業的自我宣告。

總體方差的假設檢驗

例:根據長期正常生產的資料可知,某廠所產維尼綸的纖維服從正態分佈,其方差為0.0025。

現從某日產品中隨機抽出20根,測得樣本方差為0.0042。試判斷該日纖度的波動與平時有無顯著差異(取α=0.

10)重要概念:假設檢驗的兩類錯誤

第一類錯誤/棄真錯誤:當原假設為真,但由於樣本的隨機性使樣本統計量落入了拒絕區域;

第二類錯誤/取偽錯誤:當原假設為不真,但由於樣本的隨機性使樣本統計量落入了接受區域。

第八章列聯分析

一列聯分析的概念

應用列聯表分析定性資料之間的關係的統計方法

二列聯表的概念和結構

概念:由兩個以上的變數進行交叉分類的頻數分布表

三列聯分析中的注意事項

一、條件百分表的方向:

列變數與行變數對等關係,則行位置與列位置可對調;

列變數與行變數有因果關係,一般的,自變數位於列位置,因變數位於行位置。

統計學總結

對稱分布 特別是正態分佈 均數標準差結合起來從平均水平和變異程度兩方面描述變數的分布特徵.偏態分布 中位數四分位數間距結合起來從平均水平和變異程度兩方面描述變數的分布特徵.第3章定性變數的統計描述 1.絕對數 定性資料整理中,根據資料的類別直接清點各組所得的資料,反映事物的實際水平,也是統計分析的基...

統計學概念總結

1.統計學 收集 處理 分析 解釋資料並從資料中得出結論的科學。2.描述統計 研究資料收集 處理和描述的統計學分支。3.推斷統計 研究如何利用樣本資料來推斷總體特徵的統計學分支。4.分類資料 只能歸於某一類別的非數字型資料。5.順序資料 只能歸於某一有序類別的非數字型資料。6.數值型資料 按數字尺度...

社會統計學總結

一 算數平均數 某一總體值總體單位平均所得的標誌值的水平,是反映集中趨勢最常用 最基本的平均指標。二 中位數 把總體單位某一數量標誌的各個數值按大小順序排列,位於正中處的變數值。三 平均差 各變數值對其算術平均數 或中位數 離差絕對值的算術平均數。四 標準差 各變數值對其算術平均數的離差平方的算數平...