衛生統計學知識點總結

2021-12-26 11:03:47 字數 4764 閱讀 6500

衛生統計學

★ 統計推斷:是利用樣本所提供的資訊來推斷總體特徵,包括:引數估計和假設檢驗。a引數估計是指利

用樣本資訊來估計總體引數,主要有點估計(把樣本統計量直接作為總體引數估計值)和區間估計【按預先設定的可信度(1-α),來確定總體均數的所在範圍】。b假設檢驗:是以小概率反證法的邏輯推理來判斷總體引數間是否有質的區別。

變數資料可分為定性變數、定量變數。不同型別的變數可以進行轉化,通常是由高階向低階轉化。

資料按性質可分為計量資料、計數資料和等級資料。

定量資料的統計描述

1頻率分布表和頻率分布圖是描述計量資料分布型別及分布特徵的方法。離散型定量變數的頻率分布圖可用直條圖表達。

2頻率分布表(圖)的用途:①描述資料的分布型別;②描述分布的集中趨勢和離散趨勢;③便於發現一些特大和特小的可疑值;④便於進一步的統計分析和處理;⑤當樣本含量足夠大時,以頻率作為概率的估計值。

★3集中趨勢和離散趨勢是定量資料中總體分布的兩個重要指標。

(1)描述集中趨勢的統計指標:平均數(算術均數、幾何均數和中位數)、百分位數(是一種位置引數,用於確定醫學參考值範圍,p50就是中位數)、眾數。算術均數:

適用於對稱分布資料,特別是正態分佈資料或近似正態分佈資料;幾何均數:對數正態分佈資料(頻率圖一般呈正偏峰分布)、等比數列;中位數:適用於各種分布的資料,特別是偏峰分布資料,也可用於分布末端無確定值的資料。

(2)描述離散趨勢的指標:極差、四分位數間距、方差、標準差和變異係數。四分位數間距:

適用於各種分布的資料,特別是偏峰分布資料,常把中位數和四分位數間距結合起來描述資料的集中趨勢和離散趨勢。方差和標準差:都適用於對稱分布資料,特別對正態分佈資料或近似正態分佈資料,常把均數和標準差結合起來描述資料的集中趨勢和離散趨勢;變異係數:

主要用於量綱不同時,或均數相差較大時變數間變異程度的比較。

標準差的應用:①表示變數分布的離散程度;②結合均數計算變異係數、描述對稱分布資料;③結合樣本含量計算標準誤。

定性資料的統計描述

1定性資料的基礎資料是絕對數。描述一組定性資料的資料特徵,通常需要計算相對數。定性變數可以通過頻率分布表描述其分布特徵。

2常用相對數型別:頻率型、強度型和相對比型指標。

相對比:a、b兩指標可以是絕對數、相對數或平均數。最常見的相對比是人口學中的男女性別比,流行病學中的相對危險度rr=p1/p0也是相對比指標。

3應用相對數應該注意:①防止概念混淆,避免以比代率的錯誤現象;②計算相對數時分母應有足夠數量,如果例數較少會使相對數波動較大,應該使用絕對數;③正確的計算頻率(或強度)指標的合計值。當分組的資料需要合併起來估計頻率(或強度)時,應將各組頻率的分子相加作為合併估計的分子,各組的分母相加作為合併估計的分母;④頻率型指標的解釋要緊扣總體和屬性;⑤相對數間比較要具備可比性:

要注意觀察物件是否同質、研究方法是否相同、觀察時間是否一致、觀察物件內部結構是否一致、對比不同時期資料應注意客觀條件是否相同;⑥正確進行相對數的統計推斷:在隨機抽樣的情況下,從樣本估計值推斷總體相對數應該考慮抽樣誤差,因此要進行引數估計和假設檢驗。

4醫學人口統計資料主要**為日常工作記錄(報告單、卡、冊)、統計報表、人口調查(普查和抽樣調查)。

5描述人口學特徵的常用指標一般有人口總數和反映人口學基本特徵的某些指標。人口學的基本特徵包括性別、年齡、文化、職業等,最常用來描述人口結構的是性別和年齡。人口學特徵指標:

老年人口係數、少兒人口係數、負擔係數、老少比、性別比。

6有關生育的常用指標有出生率、生育率和人口再生產指標。測量生育水平的統計指標:粗出生率、總生育率、年齡別生育率、總和生育率。

測量人口再生育的統計指標:自然增長率、粗再生率和淨再生率。

7常用的死亡統計指標有:粗死亡率、年齡別死亡率、嬰兒死亡率、新生兒死亡率、圍生兒死亡率、死因別死亡率、某病病死率和死因構成等。

8疾病統計資料主要**於:疾病報告和報表材料、醫療衛生工作記錄、疾病專題調查資料。

9⑴標準化:兩個率或多個率之間進行比較時,為消除內部構成不同的影響,採用統一的標準,對兩組或多組資料進行校正(調整),計算得到標準化率後再做比較的方法,稱為~。其目的是統一內部構成,消除混雜因素,是資料具有可比性。

⑵應用標準化法的注意事項:

1 標準化法的應用範圍很廣。當某個分類變數在兩組中分布不同時,這兩個分類變數就成為兩組頻率比較

的混雜因素,標準化的目的是消除混雜因素。

2 標準化後的標準化率,已經不再反映當時當地的實際水平,只表示相互比較的資料間的相對水平。

3 標準化法實質是找乙個標準,使兩組得意在乙個共同的平台上進行比較。選擇不同的標準,算出的標準

化率也會不同,比較的結果也未必相同,因此報告比較結果時必須說明所選用的標準和理由

④兩樣本標準化率是樣本值,存在抽樣誤差。比較兩樣本標準化率,當樣本含量較小時,還應作假設檢驗。10常用的動態數列分析指標有:

絕對增長量、發展速度與增長速度、平均發展速度與平均增長速度。

(1)絕對增長量:是說明事物在一定時期增長的絕對值,可分為:累計增長量(報告期指標與基線期指標之差)和逐年增長量(報告期指標與前一期指標之差)。

(2)發展速度與增長速度:均為相對比,說明事物在一定時期的變化,可計算定基比(即報告期指標與基線期指標的比:an/a0)和環比(報告期指標與其前一期指標之比:

an/an-1)。增長速度表示的是淨增長速度,增長速度=發展速度-100%。

(3)平均發展速度與平均增長速度:用於概括某現象在一段時期中的平均變化。平均發展速度是發展速度的幾何平均數,平均發展速度=,平均增長速度=平均發展速度-100%。

11統計表和統計圖是描述資料特徵、呈現統計分析結果的重要工具。統計表結構標題、標目、線條、數字和備註。

12常用統計圖用途:①條圖:適用於相互獨立的資料(資料有明確分組、不連續);②百分條圖、圓圖適用於構成比資料;③線圖適用於連續性資料,表達事物的動態變化(絕對差值);半對數線圖適用於連續性資料,表達事物的發展速度(相對比);④直方圖用於描述連續變數的頻數分布;⑤散點圖適用於雙變數資料,用點的排列趨勢和密集度表示兩變數的相關關係。

常用概率分布

1正態分佈(連續型隨機變數的概率分布)

(1)正態概率密度曲線特點:①關於x=μ對稱;②在x=μ處取得該概率密度函式的最大值,在x=μ±σ處有拐點;③曲線下面積為1;④正態分佈有兩個引數:位置引數μ(決定曲線在橫軸上的位置)和變異引數σ(決定曲線的形狀);⑤μ±1.

64σ面積為90%,μ±1.96σ面積為95%,μ±2.58σ面積為99%。

(2)z變換與標準正態分佈:對於任意乙個服從正態分佈n(μ,σ2)的隨機變數,可作z變:z=,變換後的z值仍然服從正態分佈,且其總體均數為0、總體標準差為1,稱此為標準正態分佈,用n(0,1)表示。

φ(z)為標準正態分佈z變數的累積面積,-∞→z的面積,即下側累計面積。

★(3)正態分佈的應用:①確定醫學參考值範圍:是指特定的「正常」人群(排除了對所研究的指標有影響的的疾病和有關因素的特定人群)的解剖、生理、生化指標及組織代謝產物含量等資料中大多數個體的取值所在範圍,習慣用該人群的95%的個體某項醫學指標的取值範圍作為該指標的醫學參考值範圍。

方法:a百分位數法:適用於任何分布型別的資料;b正態分佈法。

②質量控制圖:如果某一波動僅僅由個體差異或隨機測量誤差所致,那麼觀察結果服從正態分佈。控制圖共有7條水平線,中心線位於總體均數μ處,警戒限位於μ±2σ處,控制限位於μ±3σ處,此外還有兩條位於μ±σ處。

★(4)確定醫學參考值的步驟:①從「正常人」總體中抽樣,明確研究總體;②用統一和準確的方法測定相應的指標;③根據不同的用途選定適當的百分界限,常用95%;④根據此指標的實際意義,決定單側範圍

還是雙側範圍;⑤根據此指標的分布決定計算方法,常用的計算方法:正態分佈法、百分位數法。

2二項分布:

(1)是一種離散型隨機變數的分布型別。如果每個觀察物件陽性結果的發生概率為π,陰性結果的發生概率為(1-π);而且每個觀察物件的結果是相互對立的,那麼,重複觀察n個人,發生陽性結果的人數x的概率分布為而二項分布,記作b(n,π)。二項分布的概率函式p(x)=π(1-π)n-x, =

⑵適用條件:①每次實驗只有兩種互斥的結果;②各次實驗互相獨立;③發生成功事件的概率恆定。

⑶分布特徵:二項分布的特徵由二項分布的引數π以及觀察的次數n決定。

①圖形分布特徵:二項分布圖的高峰在μ=nπ處或附近;π=0.5時,圖形對稱;π≠0.

5時,分布不對稱,且對同一n,π離0.5愈遠,對稱性愈差。對於同一π,隨著n的增大,分布趨於對稱。

當n→∞時,只要π不太靠近0或1(特別是當nπ和n(1-π)均大於5時),二項分布趨於對稱。

②二項分布的均數和標準差:

若x服從二項分布b(n,π),則x的總體均數為μ=nπ,總體方差為σ2=nπ(1-π),總體標準差為σ=;若將出現陽性結果的頻率記為:p=,則樣本率p的總體均數為μp=π,總體方差為σ=,總體標準差為σp=,σp是頻率p的標準差,又稱頻率的標準誤,反映陽性頻率的抽樣誤差大小。

⑷累積概率計算:①二項分布出現陽性的次數至多為k次的概率為:p(x≤k)=

②出現陽性的次數至少為k次的概率為:p(x≥k)=。

3 poisson分布:

⑴是一種離散型隨機變數的分布型別,是二項分布的特例,用以描述單位時間、空間、面積等的罕見事件發生次數的概率分布。一般記作p(λ),λ是poisson分布的唯一引數。總體均數為λ=nπ。

前提條件:互斥、獨立、恆定。

⑵概率函式為:p(x)=e-λ,x為觀察單位內稀有事件的發生次數,e=2.71828。

⑶分布特性:poisson分布是非對稱的,總體引數λ值越小,分布越偏;隨著λ→∞,分布趨於對稱,當λ≥20時,poisson分布資料可按正態分佈處理。①poisson分布總體均數與總體方差相等,均為λ;②poisson分布的觀察結果可加性,即對於服從poisson分布的m歌互相獨立的隨機變數x1、x2…xm,它們的和也服從poisson分布,其均數為這個m隨機變數的均數之和。

衛生統計學知識點總結

衛生統計學 統計推斷 是利用樣本所提供的資訊來推斷總體特徵,包括 引數估計和假設檢驗。a引數估計是指利 用樣本資訊來估計總體引數,主要有點估計 把樣本統計量直接作為總體引數估計值 和區間估計 按預先設定的可信度 1 來確定總體均數的所在範圍 b假設檢驗 是以小概率反證法的邏輯推理來判斷總體引數間是否...

衛生統計學》試卷

專業學號姓名得分 一 單項選擇題 每題2分,共40分 1 標準正態分佈的中位數為 a a.0 b.1 c.0.5 d.與標準差有關 2 2檢驗能分析d a.兩樣本率差異有無統計學意義 b.多個樣本率差異有無統計學意義 c.兩有序分類變數的關聯性d.以上都對 3 醫學試驗設計的基本原則是d a.對照 ...

衛生統計學知識框架圖

正態分佈均數,標準差 計量資料偏態分布中位數,四分位間距 對數正態分佈幾何均數,幾何標準差 統計描述 計數資料 比 構成比 率 動態數列 等級資料 點估計 直接用樣本統計量的乙個數值來估計總體引數t分布未知或n較小 引數估計計量資料 分布已知或n足夠大 區間估計n 50時,直接查表 計數資料 n足夠...