統計學概念總結

2021-08-09 02:58:35 字數 5695 閱讀 7490

1. 統計學:收集、處理、分析、解釋資料並從資料中得出結論的科學。

2. 描述統計:研究資料收集、處理和描述的統計學分支。

3. 推斷統計:研究如何利用樣本資料來推斷總體特徵的統計學分支。

4. 分類資料:只能歸於某一類別的非數字型資料。

5. 順序資料:只能歸於某一有序類別的非數字型資料。

6. 數值型資料:按數字尺度測量的觀察值。

7. 觀測資料:通過調查或觀測而收集到的資料。

8. 實驗資料:在實驗中控制實驗物件而收集到的資料。

9. 截面資料:在相同或近似相同的時間點上收集的資料。

10. 時間序列資料:在不同時間上收集到的資料。

11. 抽樣調查:從總體中隨機抽取一部分單位作為樣本進行調查,並根據樣本調查結果來推斷總體特徵的資料收集方法。

12. 普查:為特定目的而專門組織的全面調查。

13. 總體:包含所研究的全部個體(資料)的集合。

14. 樣本:從總體中抽取的一部分元素的集合。

15. 樣本容量:也稱樣本量,是構成樣本的元素數目。

16. 引數:用來描述總體特徵的概括性數字度量。

17. 統計量:用來描述樣本特徵的概括性數字度量。

18. 變數:說明現象某種特徵的概念。

19. 分類變數:說明事物類別的乙個名稱。

20. 順序變數:說明事物有序類別的乙個名稱。

21. 數值型變數:說明事物數字特徵的乙個名稱。

22. 離散型變數:只能取可數值的變數。

23. 連續型變數:可以在乙個或多個區間中取任何值的變數。

24. 簡單隨機抽樣:也稱純隨機抽樣,它是從含有個元素的總體中,抽取個元素作為樣本,使得總體中的每乙個元素都有相同的機會(概率)被抽中。

25. 簡單隨機樣本:從含有個元素的總體中,抽取個元素作為樣本,使得總體中每乙個樣本量為的樣本都有相同的機會(概率)被抽中。

26. 重複抽樣:從總體中抽取乙個元素後,把這個元素放回到總體中再抽取第二個元素,直至抽取個元素為止。

27. 不重複抽樣:乙個元素被抽中後不再放回總體,而是從所剩元素中抽取第二個元素,直到抽取個元素為止。

28. 分層抽樣:也稱分類抽樣,它是在抽樣之前先將總體的元素劃分為若干層(類),然後從各個層中抽取一定數量的元素組成乙個樣本。

29. 系統抽樣:也稱等距抽樣或機械抽樣,它是先將總體中的各元素按某種順序排列,並按某種規則確定乙個隨機起點;然後,每隔一定的間隔抽取乙個元素,直至抽取個元素形成乙個樣本。

30. 整群抽樣:先將總體劃分成若干群,然後以群作為抽樣單位從中抽取部分群,隨後再對抽中的各個群中所包含的所有元素進行觀察。

31. 頻數:落在某一特定類別(或組)中的資料個數。

32. 頻數分布:資料在各類別(或組)中的分配。

33. 比例:乙個樣本(或總體)中各個部分的資料與全部資料之比。

34. 比率:樣本(或總體)中各不同類別數值之間的比值。

35. 累積頻數:將各有序類別或組的頻數逐級累加起來得到的頻數。

36. 資料分組:根據統計研究的需要,將原始資料按照某種標準劃分成不同的組別。

37. 組距分組:將全部變數值依次劃分為若干個區間,並將這一區間的變數值作為一組。

38. 組距:乙個組的上限與下限的差。

39. 組中值:每一組的下限和上限之間的中點值,即組中值=(下限值+上限值)/2。

40. 直方圖:用矩形的寬度和高度(即面積)來表示頻數分布的圖形。

41. 莖葉圖:由「莖」和「葉」兩部分組成的、反應原始資料分布的圖形。

42. 箱線圖:由一組資料的最大值、最小值、中位數和兩個四分位數5個特徵值繪製而成的、反應原始資料分布的圖形。

(一)主要術語

1. 眾數:一組資料中出現頻數最多的變數值,用表示。

2. 中位數:一組資料排序後處於中間位置上的變數值,用表示。

3. 四分位數:一組資料排序後處於25%和75%位置上的值。

4. 平均數:一組資料相加後除以資料的個數而得到的結果。

5. 幾何平均數:n個變數值乘積的n次方根,用表示。

6. 異眾比率:非眾陣列的頻數佔總頻數的比率。

7. 四分位差:也稱為內距或四分間距,上四分位數與下四分位數之差。

8. 極差:也稱全距,一組資料的最大值與最小值之差。

9. 平均差:也稱平均絕對離差,各變數值與其平均數離差絕對值的平均數。

10. 方差:各變數值與其平均數離差平方的平均數。

11. 標準差:方差的平方根。

12. 標準分數:變數值與其平均數的離差除以標準差後的值。

13. 離散係數:也稱為變異係數,一組資料的標準差與其相應的平均數之比。

14. 偏態:資料分布的不對稱性。

15. 偏態係數:對資料分布不對稱性的度量值。

16. 峰態:資料分布的平峰或尖峰程度。

17. 峰態係數:對資料分布峰態的度量值。

(一)主要術語

43. 抽樣分布:在重複選採樣本量為的樣本時,由樣本統計量的所有可能取值形成的相對頻數分布。

44. 樣本均值的抽樣分布:在重複選採樣本量為的樣本時,由樣本均值的所有可能取值形成的相對頻數分布。

45. 樣本比例抽樣分布:在重複選採樣本量為的樣本時,由樣本比例的所有可能取值形成的相對頻數分布。

46. 標準誤差:也稱為標準誤,它是樣本統計量的抽樣分布的標準差。

47. 估計標準誤差:若計算標準誤時所涉及的總體引數未知,可用樣本統計量代替計算的標準誤。

48. 估計量:用來估計總體引數的統計量的名稱,用符號表示。

49. 估計值:用來估計總體引數時計算出來的估計量的具體數值。

50. 點估計:用樣本統計量的某個取值直接作為總體引數的估計值。

51. 區間估計:在點估計的基礎上,給出總體引數估計的乙個範圍。

52. 置信區間:由樣本統計量所構造的總體引數的估計區間。

53. 置信水平:也稱為置信係數,它是將構造置信區間的步驟重複多次後,置信區間中包含總體引數真值的次數所佔的比率。

(一)主要術語

18. 假設:對總體引數的具體數值所做的陳述。

19. 假設檢驗:先對總體引數提出某種假設,然後利用樣本資訊判斷假設是否成立的過程。

20. 備擇假設:也稱研究假設,是研究者想收集證據予以支援的假設,用或表示。

21. 原假設:也稱零假設,是研究者想收集證據予以反對的假設,用表示。

22. 單側檢驗:也稱單尾檢驗,是指備擇假設具有特定的方向性,並含有符號「>」或「<」的假設檢驗。

23. 雙側檢驗:也稱雙尾檢驗,是指備擇假設沒有特定的方向性,並含有符號「」的假設檢驗。

24. 第ⅰ類錯誤:當原假設為正確時拒絕原假設,犯第ⅰ類錯誤的概率記為。

25. 第ⅱ類錯誤:當原假設為錯誤時沒有拒絕原假設,犯第ⅱ類錯誤的概率通常記為。

26. 顯著性水平:假設檢驗中發生第ⅰ類錯誤的概率,記為。

27. 檢驗統計量:根據樣本觀測結果計算得到的,並據以對原假設和備擇假設做出決策的某個樣本統計量。

28. 拒絕域:能夠拒絕原假設的檢驗統計量的所有可能取值的集合。

29. 臨界值:根據給定的顯著性水平確定的拒絕域的邊界值。

30. 值:也稱觀察到的顯著性水平,如果原假設是正確的,那麼所得的樣本結果出現實際觀測結果那麼極端的概率。

(一)主要術語

31. 方差分析( anova):檢驗多個總體均值是否相等的統計方法。

32. 因素:也稱因子,是方差分析中所要檢驗的物件。

33. 水平:也稱處理,是因素的不同表現。

34. 組內誤差:來自水平內部的資料誤差。

35. 組間誤差:來自不同水平之間的資料誤差。

36. 總平方和:反映全部資料誤差大小的平方和,記為sst。

37. 組內平方和:反映組內誤差大小的平方和,記為sse。

38. 組間平方和:反映組間誤差大小的平方和,記為ssa。

39. 單因素方差分析:只涉及乙個分型別自變數的方差分析。

40. 組內方差:組內平方和除以相應的自由度。

41. 組間方差:組間平方和除以相應的自由度。

(一)主要術語

42. 相關關係:變數之間存在的不確定的數量關係。

43. 相關係數:也稱pearson相關係數,是根據樣本資料計算的度量兩個變數之間線性關係強度的統計量。

44. 因變數:被**或被解釋的變數,用y表示。

45. 自變數:用來**或用來解釋因變數的乙個或多個變數,用x表示。

46. 回歸模型:描述因變數y如何依賴於自變數x和誤差項的方程。

47. 回歸方程:描述因變數y的期望值如何依賴於自變數x的方程。

48. 估計的回歸方程:根據樣本資料求出的回歸方程的估計。

49. 最小二乘法:也稱最小平方法,使因變數的觀察值與估計值之間的離差平方和達到最小來求得和的方法。

50. 判定係數:回歸平方和佔總平方和的比例,記為。

51. 估計量的標準誤差:均方殘差(mse)的平方根,用來表示。

52. 的平均值的點估計:利用估計的回歸方程,對於的乙個特定值,求出的平均值的乙個估計值。

53. 的個別值的估計值:利用估計的回歸方程,對於的乙個特定值,求出的乙個個別值的估計值。

54. 的平均值的置信區間估計:對的乙個給定值,求出的平均值的區間估計。

55. 的個別值的**區間估計:對的乙個給定值,求出的乙個個別值的區間估計。

56. 多元線性回歸模型:描述因變數如何依賴於自變數和誤差項的方程。

57. 多元線性回歸方程:描述的期望值如何依賴於的方程。

58. 估計的多元線性回歸方程:根據樣本資料得到的多元線性回歸方程的估計。

59. 多重判定係數:在多元回歸中,回歸平方和佔總平方和的比例。

60. 修正的多重判定係數:用模型中自變數的個數和樣本量進行調整的多重判定係數,記為。

8、主要術語和公式

(一)主要術語

61. 時間序列:同一現象在不同時間上的相繼觀察值排列而成的序列。

62. 平穩序列:基本上不存在趨勢的序列。

63. 非平穩序列:包含趨勢性、季節性或週期性的序列。

64. 趨勢:也稱長期趨勢,是指時間序列在長時期內呈現出來的某種持續向上或持續下降的變動。

65. 季節性:也稱季節變動,是指時間序列在一年內重複出現的週期性波動。

66. 週期性:也稱迴圈波動,是指時間序列中呈現出來的圍繞長期趨勢的一種波浪形或振盪式變動。

67. 隨機性:也稱不規則波動,是指時間序列中除去趨勢、週期性和季節性之後的偶然性波動。

68. 增長率:也稱增長速度,是指時間序列中報告期觀察值與基期觀察值之比減1後的結果,用%表示。

69. 平均增長率:也稱平均發展速度,是指時間序列中各逐期環比值(也稱環比發展速度)的幾何平均數減1後的結果。

70. 增長1%絕對值:增長率每增長乙個百分點而增加的絕對數量。

71. 簡單平均法**:根據過去已有的期觀察值通過簡單平均來**下一期的數值。

72. 移動平均法**:通過對時間序列逐期遞移求得平均數作為**值的一種**方法。

73. 指數平滑法**:對過去的觀察值加權平均進行**的一種方法,該方法使得第+1期的**值等於期的實際觀察值與第期指數**值的加權平均值。

(一)主要術語

74. 指數:測定多個專案在不同場合下綜合變動的相對數。

75. 加權綜合指數:通過加權來測定一組專案的綜合變動狀況的指數。

76. 加權平均指數:以某一時期的價值總量為權數對個體指數加權平均計算的指數。

77. 價值指數:由兩個不同時期的價值總量對比形成的指數。

78. 指數體系:由價值指數及其若干個因素指數構成的數量關係式。

79. 零售**指數:反映城鄉商品零售**變動趨勢的一種經濟指數。

統計學總結

單選20 1 20 簡答題3 5 15 計算題65 第一章導論 一什麼是統計 包括統計研究的主要內容 統計學是一門收集 整理 顯示和分析統計資料的科學 二與其他學科有什麼關係 數學,工商 1統計學與數學都是研究數量規律的,都要利用各種公式進行運算。數學中的概率論,為統計學提供了數量分析的理論基礎。統...

統計學總結

對稱分布 特別是正態分佈 均數標準差結合起來從平均水平和變異程度兩方面描述變數的分布特徵.偏態分布 中位數四分位數間距結合起來從平均水平和變異程度兩方面描述變數的分布特徵.第3章定性變數的統計描述 1.絕對數 定性資料整理中,根據資料的類別直接清點各組所得的資料,反映事物的實際水平,也是統計分析的基...

醫學統計學的基本之概念

第八章醫學統計學基本內容 衛生學 7 醫學統計與流行病學系駱福添 2011 2 19羊城晚報a4版 統計方法不同導致房價打架 1月廣州一手房價,網簽資料,國家統計局公布環比上公升1.7 廣州市房管局公布下降5.8 2010 3 5羊城晚報a14版 統計紛亂房價指數似兒戲 官方統計 去年全國房價 1....