4統計學重點總結

2022-03-26 13:32:30 字數 3660 閱讀 6173

1 四分位數間距(inter-quartile rangeq)百分位數p75和百分位數p25分別稱為上四分位數和下四分位數,四分位數間距表示百分位數p75和百分位數p25之差,常與中位數一起使用,描述偏態分布資料的分布特徵,較極差穩定。

2 變異係數(coefficient of variation)用於觀察指標單位不同或均數相差較大時兩組資料變異程度的比較。用cv表示

3 小概率事件:習慣上,將p≤0.05或p≤0.01稱為「小概率事件」,表明在一次觀察或實驗中該事件發生的可能性很小,可以看作很可能不發生

4 抽樣誤差:由個體變異產生的、由於抽樣而造成的樣本統計量與樣本統計量及樣本統計量與總體引數之間的差異稱為抽樣誤差。無傾向性,不可避免。

5 均數的標準誤:用於表示均數抽樣誤差的指標叫樣本均數的標準差,也稱樣本均數的標準誤

6 總體引數的置信區間(confidence interval ci):按預先給定的概率(1-α)估計總體引數的可能範圍,該範圍就稱為總體引數的1-α置信區間。預先給定的概率(1-α)稱為置信度,常取95%或99%。

如無特別說明,一般取雙側95%。可信區間由兩個數值即置信限構成,其中最小值稱為下限,最大值稱為上限。嚴格講,可信區間不包括上下限兩個端點值

7 第ⅰ類錯誤:如果實際情況與h0一致,僅僅由於抽樣的原因,使得統計量的觀察值落到拒絕域,拒絕原本正確的h0,導致推斷結論錯誤。這樣的錯誤稱為第ⅰ類錯誤。

犯第ⅰ類錯誤的概率大小為α。

8 第ⅱ類錯誤:如果實際情況與h0不一致,也僅僅由於抽樣的原因,使得統計量的觀察值落到接受域,不能拒絕原本錯誤的h0,導致了另一種推斷錯誤。這樣的錯誤稱為第ⅱ類錯誤。

犯第ⅱ類錯誤的概率為β。

9 1-β稱為假設檢驗的功效:當所研究的總體與h0確有差別時,按檢驗水準α能夠發現它(拒絕h0)的概率。一般情況下對同一檢驗水準α,功效大的檢驗方法更可取。

在醫學科研設計中,檢驗功效(1-β)不宜低於0.75,否則檢驗結果很可能反映不出總體的真實差異,出現非真實的陰性結果。

10 相關係數:它又稱為積差相關係數,以符號r 來表示相關係數,它是說明兩變數間相關關係的密切程度和相關方向。

11.最小二乘法:引數與一般只能通過樣本資料來估計。

當x取值為xi時,y的平均值的估計應為a+bxi,而實際觀察值為yi。兩者之差稱為殘差(residual),即當a與b取不同值時獲取不同的候選直線,如能求a與b的適宜值,能使所有實測值到這條直線的上縱向距離的平方和為最小,則稱這一對a和b為與的最小二乘估計

12.回歸係數:y=a+bx,a為y軸上的截距;b為斜率,表示x每改變乙個單位,y的變化的值,稱為回歸係數

簡答題1.頻數分布表繪製步驟

(1) 求全距

(2) 定組段數與組距 : 8~15個組段,組距i=全距/組段數

(3) 劃組段:①兩端的組段應分別包含最小值或最大值;②盡量取較整齊的數值作為組段的端點,便於對資料進行表述;③組距以相等為宜。

下限:每個組段的起點(最小值) 。

上限:每個組段的終點(近似最大值)。

注:最後乙個組段應同時寫出上限和下限來。

(4) 繪製整理表 「下限≤x<上限」

注:各組段的頻數之和應等於總的觀察例數。

2.應用相對數時應注意的問題

1. 防止概念混淆。

2. 頻率型指標的解釋要根據總體與屬性。

3. 計算相對數時分母應用足夠的數量

4.正確的合併估計頻率型指標

5.資料的對比應注意可比性

1)觀察物件同質,研究方法相同,觀察時間相等,以及民族、地區等客觀條件一致。

2)其他影響因素在各組的內部構成是否相同。

3)對內不構成不同的資料,應先進行標準化

6.相對數的統計推斷,要考慮抽樣誤差

3.參考值範圍:指特定的「正常」人群的解剖、生理、生化、免疫等各種資料的波動範圍。

制定參考值範圍的步驟:

1. 選擇足夠數量的正常人作為調查物件。

2. 樣本含量足夠大。

3. 確定取單側還是取雙側正常值範圍。

4. 選擇適當的百分界限。

5. 選擇適當的方法。

估計醫學參考值範圍的方法:

1. 正態近似法:適用於正態分佈或近似正態分佈的資料。

2. 百分位數法:適用於偏態分布資料。

4.方差分析的基本思想

根據資料的設計型別及研究目的,即按變異的不同**將全部觀察值間的總變異分為兩個或多個部分,其自由度也分解為相應的部分,除隨機誤差外,其餘每個部分的變異可由某個因素的作用加以解釋,(如各組均數間的變異ss組間可由處理因素的作用加以解釋),通過比較可能由某因素所致變異的均方與隨機誤差的均方,借助f分布作出統計推斷,從而了解該因素對觀測指標有無影響。方差分析的應用條件是:1)各樣本是相互獨立的隨機樣本;即任何兩個觀察值之間均不相關;2)各樣本來自正態總體;3)各處理組總體方差相等,即方差齊(homogeneity of variance)。

簡單地概括為任何觀察值xij都是獨立地來自具有等方差的正態總體。

5.假設檢驗與區間估計的關係

區間估計與假設檢驗是統計推斷的兩種方法。可信區間用於說明量的大小即推斷總體均數的範圍,而假設檢驗用於推斷質的不同即判斷兩總體均數是否不同。每一種區間估計都可以對應一種假設檢驗方法。

它們之間既相互聯絡,又有區別。置信區間具有假設檢驗的主要功能;假設檢驗提供而置信區間不提供的資訊;在統計推斷結論為拒絕h0時,假設檢驗可以報告確切的p值,從而較為精確地說明檢驗結論的概率保證。置信區間只能在預先確定的置信度100(1-α)%水平上進行推斷。

在不能拒絕h0的場合,假設檢驗可以對檢驗的功效作出估計,從而可以評價是否在識別差異能力較強的情形下不拒絕h0的。而置信區間並不提供這方面的資訊。根據以上的結論,置信區間與相應的假設檢驗既能提供相互等價的資訊,又有各自不同的功能。

把置信區間與假設檢驗結合起來,可以提供更全面、完整的資訊。因此,國際上規定,在報告假設檢驗結論的同時,必須報告相應的區間估計結果。

6.兩組獨立樣本秩和檢驗基本思想

假設含量為n1與n2的兩個樣本(且n1 n2),來自同一總體或者分布相同的兩個個體,則n1樣本的秩和t1與理論秩和n1(n+1)/2相差不大,即[t- n1(n+1)/2]僅為抽樣誤差所致。當二者相差懸殊,超出抽樣誤差可解釋的範圍時,則有理由懷疑該假設,從而拒絕h0

7.線性相關與回歸有何聯絡和區別

主要區別有三點:

1.線性相關分析涉及到變數之間的呈線性關係的密切程度,線性回歸分析是在變數存**性相關關係的基礎上建立變數之間的線性模型;

2.線性回歸分析可以通過回歸方程進行控制和**,而線性相關分析則無法完成;

3.線性相關分析中的變數地位平等,都是隨機變數,線性回歸分析中的變數有自變數和因變數之分,而自變數一般屬確定性變數,因變數是隨機變數。

相關關係是指現象之間確實存在的,但關係值不固定的相互依存關係。即對於某一變數的每乙個數值,另一變數有若干個數值與之相適應。直線相關(或線性相關)。

當相關關係的自變數x發生變動,因變數y值隨之發生大致均等的變動,從影象上近似地表現為直線形式,這種相關通稱為直線(或線性)相關。

相關關係能說明現象間有無關係,但它不能說明乙個現象發生一定量的變化時,另乙個變數將會發生多大量的變化。也就是說,它不能說明兩個變數之間的一般數量關係值。

回歸分析,是指在相關分析的基礎上,把變數之間的具體變動關係模型化,求出關係方程式,就是找出乙個能夠反映變數間變化關係的函式關係式,並據此進行估計和推算。通過回歸分析,可以將相關變數之間不確定、不規則的數量關係一般化、規範化。從而可以根據自變數的某乙個給定值推斷出因變數的可能值(或估計值)。

醫學統計學 重點總結

第一章總體 總體 population 是根據研究目的確定的同質觀察單位 研究物件 的全體,實際上是某一變數值的集合。可分為有限總體和無限總體。總體中的所有單位都能夠標識者為有限總體,反之為無限總體。樣本 從總體中隨機抽取部分觀察單位,其測量結果的集合稱為樣本 sample 樣本應具有代表性。所謂有...

醫學統計學重點總結

簡述標準差與標準誤的聯絡與區別?標準差和標準誤都是變異指標,但它們之間有區別,也有聯絡。區別 概念不同 標準差是描述觀察值 個體值 之間的變異程度 標準誤是描述樣本均數的抽樣誤差 用途不同 標準差常用於表示變數值對均數波動的大小,與均數結合估計參考值範圍,計算變異係數,計算標準誤等。標準誤常用於表示...

統計學考試重點

一.題型分布 1.單選 x15 每個一分 2.多選x5 每個兩分,少選得一分,多選不得分 3.判斷x10 每個一分 4.填空x10 每個一分 5.計算題x4 總分55分,計算題分別出自五 六 八 十章 二.考試重點 1.考試重點章節為 四 五 六 八 十章,其它章節的題目主要分布在單選多選判斷與填空...