統計學複習

2021-04-10 13:31:50 字數 4185 閱讀 9531

統計學 (統計學的應用領域(工商管理方面)

1.企業發展戰略,2.產品質量管理,3市場研究,4.財務分析,5.經濟**,6.人力資源管理)

主要術語概念(選擇判斷)

1. 總體:包含所研究的全部個體(資料)的集合。

2. 樣本:從總體中抽取的一部分元素的集合。

3. 引數:用來描述總體特徵的概括性數字度量。

4. 統計量:用來描述樣本特徵的概括性數字度量。

5. 變數:說明現象某種特徵的概念。

6. 簡單隨機抽樣:也稱純隨機抽樣,它是從含有個元素的總體中,抽取個元素作為樣本,使得總體中的每乙個元素都有相同的機會(概率)被抽中。

7. 分層抽樣:也稱分類抽樣,它是在抽樣之前先將總體的元素劃分為若干層(類),然後從各個層中抽取一定數量的元素組成乙個樣本。

8. 系統抽樣:也稱等距抽樣或機械抽樣,它是先將總體中的各元素按某種順序排列,並按某種規則確定乙個隨機起點;然後,每隔一定的間隔抽取乙個元素,直至抽取個元素形成乙個樣本。

9. 整群抽樣:先將總體劃分成若干群,然後以群作為抽樣單位從中抽取部分群,隨後再對抽中的各個群中所包含的所有元素進行觀察。

10. 估計量:用來估計總體引數的統計量的名稱,用符號表示。

11. 估計值:用來估計總體引數時計算出來的估計量的具體數值。

12. 點估計:用樣本統計量的某個取值直接作為總體引數的估計值。

13. 區間估計:在點估計的基礎上,給出總體引數估計的乙個範圍。

14. 置信區間:由樣本統計量所構造的總體引數的估計區間。

15. 置信水平:也稱為置信係數,它是將構造置信區間的步驟重複多次後,置信區間中包含總體引數真值的次數所佔的比率。

16. 假設檢驗:先對總體引數提出某種假設,然後利用樣本資訊判斷假設是否成立的過程。

17. 單側檢驗:也稱單尾檢驗,是指備擇假設具有特定的方向性,並含有符號「>」或「<」的假設檢驗。

18. 拒絕域:能夠拒絕原假設的檢驗統計量的所有可能取值的集合。

19. 臨界值:根據給定的顯著性水平確定的拒絕域的邊界值。

20. 值:也稱觀察到的顯著性水平,如果原假設是正確的,那麼所得的樣本結果出現實際觀測結果那麼極端的概率

21. 相關關係:變數之間存在的不確定的數量關係。

22. 相關係數:也稱pearson相關係數,是根據樣本資料計算的度量兩個變數之間線性關係強度的統計量。

23. 最小二乘法:也稱最小平方法,使因變數的觀察值與估計值之間的離差平方和達到最小來求得和的方法。

第一章1.理解「總體」,「樣本」,「變數」 p7-p9

第2章2.理解「簡單隨機抽樣」,「分層抽樣」,「整群抽樣」,「系統抽樣」 p18

3.理解「非抽樣誤差」p35和「誤差的控制」p39

第3章4.看一下品質資料的整理與展示,注重「分類資料的整理與展示」 p52

5.「資料型資料的整理與展示」 p61 注重數值型資料的圖示。

第4章6.集中趨勢的度量:理解眾數,中位數,分位數 p86-p88

7.加權平均數的公式 p92

8.組中值的平均數計算,例題p92

9.標準差公式 p100

10.標準分數公式 p101

11.離散係數公式 p103

12.當k取不同值時表示的含義 p107

第7章13.點估計與區間估計 p177

14.理解置信區間餓3點 p179

15.評價估計量的標準:無偏性,有效性,一致性(理解) p181

16.總體均值的區間估計 p183

17.例題7.2 p184

18.不同情況下總體均值的區間估計(**) p186

19.總體比例的區間估計 p187

20.例題7.4 p187 例題7.7 p191 例題7.8 p192

21.樣本量的確定 p201

第8章22.理解「兩類錯誤」的含義 p213

23.假設檢驗的流程 p215-p217 (不考計算,單選或判斷)

24.左單側檢驗右單側檢驗 (單選,判斷)

第11章

25.變數間關係的度量 p312

26.散點圖含義 p314 不同形態的散點圖代表的意思 p315

27.相關係數公式 p317

28.相關係數的性質 p318

29.一元線形回歸方程 p323

30.估計的回歸方程 p323

31.解方程組的公式: p324

32.時間序列的描述性分析重點 p388-p391

理解(選擇判斷)

1.抽樣誤差,非抽樣誤差,誤差的控制.p35,p39

抽樣誤差:由於抽樣的隨機性引起的樣本,結果與總體真值之間的誤差.(是一種隨機性誤差,只存在於概率抽樣中)

抽樣誤差的控制:它是不可避免的,控制方法:改變樣本量,抽樣誤差越小,所需要的樣本量就越大.

非抽樣誤差:相對抽樣誤差而言,是指抽樣誤差之外的,由於其他原因引起的樣本觀察結果與總體真值之間的差異.(不但存在概率誤差,而且存在於非概率誤差)

非抽樣誤差的控制:主要是調查過程的質量控制.(包括調查員的挑選,調查員的培訓,督導員的調查專業水平,對調查過程進行獎懲的制度,等等)

2.資料的整理與展示

3.離散程度的度量 p96

資料的離散程度越大,集中趨勢的測度值對該組資料的代表性就越差;越小代表性就越好..主要採用測度值來描述.根據資料型別的不同主要的測度值主要有異比眾率(分類資料),四分位差(順序資料),方差和標準差,極差,平均差(數值型資料)

4.點估計與區間估計含義p177

點估計:是用樣本統計量的某乙個取值直接作為總體引數θ的估計值.

區間估計:在點估計的基礎上,給出總體引數估計的乙個區間範圍,該區間通常由樣本統計量加減抽樣誤差得到.

5.對置信區間的理解,注意的幾點:p179

(1)如果用某種方法構造的所有區間中有95%的區間包含總體引數的真值,5%的區間不包含總體引數的真值,那麼,用該方法的構造的區間稱為置信水平為95%的置信區間.

(2)總體引數的真值是固定的,未知的,而用樣本構造的區間則是不固定的.

(3)在實際問題中,進行估計時往往只抽取乙個樣本,此時所構造的是與該樣本相聯絡的一定置信水平(比如95%)下的置信區間.

6.評價估計量的標準予p180

1.無偏性:是指估計量抽樣分布的數學期望等於被估計的總體引數.設總體引數為θ,所選擇的估計量為 ,如果e( )=θ,則稱為θ的無偏估計量.

2.有效性:對同一總體引數的兩個無偏估計量,有更小標準差的估計量更有效.

(3)一致性:指隨差樣本量的增大,點估計量的值越來越接近被須總體的引數.

7.兩類錯誤區p213

α錯誤(棄真錯誤):原假設ho為真卻被我們拒絕了,犯這種錯誤的概率α用表示。

β錯誤(取偽錯誤):原假設為偽我們卻沒有拒絕,犯這種錯誤的概率β用表示。

8.假設檢驗的流程。p215 利用p值進行決策p217

9.單側檢驗p218

1左單側檢驗 (越大越好)

2.右單側檢驗 (越小越好)

10.變數間關係的度量 p312

11.散點圖含義 p314 不同形態的散點圖代表的意思 p315

12.相關係數的含義,性質p318

相關係數是根據計算的度量兩個變數之間線性關係強度的統計量。總體相關係數用ρ表示,樣本相關係數用r表示。

性質:(1)相關係數r的取值範圍是-1≤r ≤ 1,一般取小數點後兩位。 r的正負號表明兩變數間變化的方向;|r|表明兩變數間相關的程度,r>0表示正相關,r<0表示負相關,r=0表示零相關。

|r|越接近於1,表明兩變數相關程度越高,它們之間的關係越密切。

①取值範圍:| r | ≤1

②表示相關方向:r >0為正相關;r >0為負相關。

③判別相關程度的方法及標準:r=0為不相關,| r |<0.3為微弱相關,0.

3<|r|<0.5為低度相關,0.5<|r|<0.

8為顯著相關,0.8<| r |<1為高度相關,| r |=1為完全相關。

(2)r具有對稱性。

(3)r數值大小與x和y的原點及尺度無關。

(4)r僅僅是x與y之間線性關係的乙個度量,它不能用於描述非線性相關係。

(5)r雖然是兩個變數之間線性關係的乙個度量,卻不一定意味著x與y一定有因果關係。

13.時間序列的描述性分析重點 p388-p391

主要公式(計算題)

(一)集中趨勢的度量主要公式

(二)抽樣分布主要公式

統計學複習

例1 某廠計畫完成工業增加值200萬元,實際完成220萬元,則 例2 3月份的計畫生產成本為100萬元,實際生產成本為120萬元,則其計畫完成相對數為 例5 某廠計畫2000年勞動生產率要比上年提高4 實際提高5 則 例6 某企業計畫產品單位成本比上年降低5 實際降低6 則 例7 某工廠在2005年...

統計學複習

第一章1.統計 包含三方面的含義,統計工作 或統計活動 統計資料和統計學。3.統計活動 一般包括統計設計 統計調查 統計整理 統計分析等這幾個階段依次進行。4.統計資料 統計資料是指統計工作過程中所產生的統計資料 統計報表 統計圖表 統計分析報告 文 以及與之相聯絡的其他資料的總稱。5.統計學 是指...

統計學複習

1 統計學是用以收集資料,分析資料和由資料得出結論的一組概念 原則和方法。2 統計的基本涵義包括三種不同的含義,即統計工作 統計資料 統計科學。統計工作即統計實踐活動,是人們利用各種科學的統計方法,蒐集 整理 分析和提供統計資料工作的總稱 統計資料即統計工作過程所取得的成果,是反映被調查研究的客觀事...