一、名詞解釋題
1. 總體(population):根據研究目的所確定的同質觀察單位的全體。
只包括(確定的時間和空間範圍內)有限個觀察單位的總體,稱為有限總體(finite population)。假想的,無時間和空間概念的,稱為無限總體(infinite population)。
2. (總體)引數(parameter):總體的統計指標或特徵值。總體引數是事物本身固有的、不變的。
3. 樣本(sample):從總體中隨機抽取的部分個體。
4. 樣本含量(sample size):樣本中所包含的個體數。
5. 變數(variable):觀察物件個體的特徵或測量的結果。
由於個體的特徵或指標存在個體差異,觀察結果在測量前不能準確**,故稱為隨機變數(random variable),簡稱變數(variable)。變數的取值稱為變數值或觀察值(observation)。根據變數的取值特性,分為數值變數和分類變數。
6. 數值變數(numerical variable):又稱為計量資料、定量資料,指構成其的變數值是定量的,其表現為數值大小,有單位。
對每個觀察單位用定量的方法測定某項指標的數值,組成的資料。
7. 計數資料:將全體觀測單位按照某種性質或特徵分組,然後再分別清點各組觀察單位的個數。
分類變數(categorical variable):或稱定性變數,其取值是定性的,表現為互不相容的類別或或屬性,有兩種情況:
1)無序分類(unordered categories):包括①二項分類,如上述「性別」變數,表現為互相對立的結果;②多項分類,如上述「血型」變數,表現為互不相容的多類結果。
2)有序分類(ordered categories):各類之間有程度上的差別,或等級順序關係,有「半定量」的意義,亦稱等級變數。
等級資料:介於計量資料和計數資料之間的一種資料,通過半定量方法測量得到。
8. 抽樣(sampling):從總體中抽取部分觀察單位的過程稱為抽樣。
9. 抽樣誤差(sampling error):由於抽樣造成的統計量與引數之間的差別,特點是不能避免的,可用標準誤描述其大小。
10. 誤差(error):統計上所說的誤差泛指測量值與真值之差,樣本指標與總體指標之差。主要有以下二種:系統誤差和隨機誤差 。
11. 可信區間(confidence interval, ci):按一定的概率或可信度(1-α)用乙個區間估計總體引數所在範圍,這個範圍稱作可信度1-α的可信區間,又稱置信區間。
12. 總體均數的可信區間:按一定的概率大小估計總體均數所在的範圍(ci)。常用的可信度為95%和99%,故常用95%和99%的可信區間。
13. 變異(variation):同質事物間的差別。由於觀察單位通常即為觀察個體,故變異亦稱為個體變異(individual variation)。
14. 組間變異(variation between group):用各組均數與總均數的離均差平方和表示
15. 組內變異(variation within group):用各組均數與總均數的離均差平方和表示
18. 百分位數(percentile):是一種位置指標,以px表示,乙個百分位數px將全部觀察值分為兩個部分,理論上有x%的觀察值小於px小,有(1-x%)的觀察值大於px。
19. 變異係數(coefficient of variance, cv):亦稱離散係數(coefficient of dispersion),為標準差與均數之比,常用百分數表示。
, 變異係數沒有度量衡單位,常用於比較度量單位不同或均數相差懸殊的兩組或多組資料的離散程度。
21. 頻率(relative frequency):在n次隨機試驗中,事件a發生了m次,則比值
稱為事件a在n次試驗中出現的頻率(relative frequency)。m稱為出現的頻數(frequency)。
在實際工作中,當觀察單位的例數足夠多時,可以用頻率來代替概率。頻率是概率的估計值。
22. 概率(probability):在重複試驗中,事件a的頻率,隨著試驗次數的不斷增加將愈來愈接近乙個常數p,這個常數p就稱為事件a出現的概率(probability),記作p(a)或p。
描述隨機事件發生的可能性大小的數值,常用p來表示。
23. 統計量(statistic):由樣本所算出的統計指標或特徵值。
24. 相關係數(correlation coefficient):用以說明具有直線關係的兩個變數間相關關係的密切程度和相關方向的指標,稱為相關係數,又稱為積差相關係數(coefficient of product-moment correlation),總體相關係數用希臘字母ρ表示,而樣本相關係數用r表示,取值範圍均為[-1, 1]。
25. 回歸係數(regression coefficient):直線回歸方程= a+bx的係數b稱為回歸係數,也就是回歸直線的斜率(slope),表示x 每增加乙個單位,y 平均改變 b 個單位。
26. 參考值範圍(reference range):也稱為正常值範圍(normal range),醫學上常把絕大多數正常人的某指標值範圍稱為該指標的正常值範圍。
絕大多數:可以是90%、95%、99%等等,最常用的是95%。正常人:
不是指健康人,而是指排除了影響所研究指標的疾病和有關因素的同質人群。又稱參考值範圍,是指特定健康人群的解剖、生理、生化等各種資料的波動範圍。習慣上是確定包括95%的人的界值。
27. 正偏態和負偏態分布:頻數分布可分為對稱分布和非對稱分布兩種型別。
非對稱分布又稱為偏態分布,是指觀察值偏離**的分布。當尾部偏向數軸正側(或右側)時,稱正偏態(或右偏態)分布,如人體中一些重金屬元素的分布等。反之,尾部偏向數軸負側(或左側)時,則稱為負偏態(或左偏態)分布。
28. 統計推斷(statistic inference):從總體中隨機抽取一定含量的樣本進行研究,目的是通過樣本的資訊判斷總體的特徵,這一過程稱為統計推斷。
29. 標準誤(standard error, se):在統計理論上將樣本統計量的標準差稱為標準誤,用來衡量抽樣誤差的大小。據此,樣本均數的標準差稱為標準誤。
30. 引數估計(parameter estimation):由樣本資訊估計總體引數。
它包括兩種:點估計(point estimation)和區間估計(interval estimation)。
31. 點估計(point estimation):直接用樣本統計量作為對應的總體引數的估計值。
32. 區間估計(interval estimation):按一定的概率或可信度(1-α)用乙個區間估計總體引數所在範圍,這個範圍稱作可信度1-α的可信區間(confidence interval, ci),又稱置信區間。
這種估計方法稱為區間估計。
33. 95%可信區間含義:如果重複若干次樣本含量相同的抽樣,每個樣本均按同一方法構建95%可信區間,則在這些可信區間中,理論上有95個包含了總體引數,還有5個未估計到總體均數。
34.ⅰ類錯誤(typeⅰerror):統計學上規定,拒絕了實際上成立的h0,這類「棄真」的錯誤稱為ⅰ型錯誤或第一類錯誤,ⅰ型錯誤的概率用α表示。
35.ⅱ類錯誤(typeⅱerror):統計學上規定,不拒絕實際上不成立的h0,這類「存偽」的錯誤稱為ⅱ型錯誤或第二類錯誤,ⅱ型錯誤的概率用β表示。
36. 檢驗效能(power of a test):又稱把握度,即兩總體確有差別,按α水準能發現它們有差別的能力。
37. 引數檢驗:總體分布已知,對其中一些未知引數進行估計或檢驗。這類統計推斷的方法叫引數統計或引數檢驗。
引數檢驗:假定比較資料服從某分布,通過引數的估計量(, s)對比較總體的引數(μ)作檢驗,統計上稱為引數法檢驗(parametric test)。如t、u檢驗、方差分析。
38. 非引數檢驗:適用於任意分布(distribution free)的統計方法,這種方法稱為非引數統計。這種假設檢驗方法,比較的是分布而不是引數,故稱為非引數檢驗。
非引數檢驗:是指在統計檢驗中不需要假定總體分布形式和用引數估計量,直接對比較資料的分布進行統計檢驗的方法,稱為非引數檢驗(nonparametric test).
39. 率(rate):又稱頻率指標,用以說明某現象發生的頻率或強度。常以百分率(%)、千分率(‰)、萬分率(1/萬)、十萬分率(1/10萬)等表示。其計算公式為:
40. 構成比(proportion):又稱構成指標,它說明一種事物內部各組成部分所佔的比重或分布,常以百分數表示,其計算公式為:
41. 比(ratio):又稱相對比,是a、b兩個有關指標之比,說明a為b的若干倍或百分之幾,它是對比的最簡單形式。其計算公式為:比=a/b。
二、問答題和簡答題
5. 標準差與標準誤有何區別和聯絡?
區別:(1)含義不同: ①s描述個體變數值(x)之間的變異度大小,s越大,變數值(x)越分散;反之變數值越集中,均數的代表性越強。
②標準誤是描述樣本均數之間的變異度大小,標準誤越大,樣本均數與總體均數間差異越大,抽樣誤差越大;反之,樣本均數越接近總體均數,抽樣誤差越小。
(2)與n的關係不同: n增大時,①s→σ(恆定)。②標準誤減少並趨於0(不存在抽樣誤差)。
(3)用途不同: ①s:表示x的變異度大小,計算cv,估計正常值範圍,計算標準誤等②:引數估計和假設檢驗。
聯絡: 二者均為變異度指標,樣本均數的標準差即為標準誤,標準差與標準誤成正比。
6. 應用相對數時的注意事項有哪些?
①要注意絕對數與相對數結合應用;②要注意觀察單位樣本數不宜過小;③要注意分子分母正確選用;④要注意率與比的正確應用;⑤要注意平均率的計算方法;⑥要注意資料的可比性;⑦率和構成比比較時作假設檢驗。
醫學統計學基礎複習
1.舉例說明什麼是總體和樣本 2.舉例說明什麼是引數和統計量 3.為什麼要強調隨機抽樣,而非隨意抽樣 4.什麼是小概率事件,有何具體應用 5.隨機誤差和系統誤差各自有何特點 6.舉例說明什麼是定量資料 什麼是定性資料,有何特點7.什麼是統計描述 8.什麼是統計推斷 9.頻數表和直方圖有何作用 10....
醫學統計學複習筆記
16 相對數作用 1 表示事物出現的頻率 2 便於比較。常用的相對數有 率 構成比 相對比。17 率和構成比的區別和聯絡 18 正態分佈 以均數為中心,成對稱鐘形分布,均數是位置引數,均數越大向右移 標準差是形態引數,標準差越大越矮胖。用於定量資料。19 標準正態分佈 n 0,1 20 二項分布用於...
醫學統計學複習最終版
第1章緒論 醫學統計學是一門 運用統計學的原理和方法,研究醫學科研中有關資料的收集 整理和分析的應用科學。1 個體 又稱觀察單位,是統計研究的最基本單位,也是構成總體的最基本的觀察單位。2 總體 根據研究目的確定的同質觀察單位某項指標測量值 觀察值 的集合。分為有限總體 明確規定了空間 時間 人群範...