2.1什麼是二手資料?使用二手資料應注意什麼問題?
與研究內容有關,由別人調查和試驗而來已經存在,並會被我們利用的資料為「二手資料」。使用時要進行評估,要考慮到資料的原始收集人,收集目的,收集途徑,收集時間使用時要註明資料**。
2.2比較概率抽樣和非概率抽樣的特點,指出各自適用情況
概率抽樣:抽樣時按一定的概率以隨機原則抽取樣本。每個單位別抽中的概率已知或可以計算,當用樣本對總體目標量進行估計時,要考慮到每個單位樣本被抽到的概率。
技術含量和成本都比較高。如果調查目的在於掌握和研究物件總體的數量特徵,得到總體引數的置信區間,就使用概率抽樣。
非概率抽樣:操作簡單,時效快,成本低,而且對於抽樣中的統計學專業技術要求不是很高。它適合探索性的研究,調查結果用於發現問題,為更深入的數量分析提供準備。
它同樣使用市場調查中的概念測試(不需要調查結果投影到總體的情況)。
2.3除了自填式,面訪式和**式還有什麼蒐集資料的辦法
試驗式和觀察式等
2.4自填式,面訪式和**式各自的長處和弱點
自填式;優點:1調查組織者管理容易2成本低,可進行大規模調查3對被調查者,可選擇方便時間答卷,減少回答敏感問題壓力。缺點:
1返回率低2不適合結構複雜的問卷,調查內容有限3調查周期長4在資料蒐集過程中遇見問題不能及時調整。
面訪式;優點:1回答率高2資料質量高3在調查過程中遇見問題可以及時調整。缺點:1成本比較高2蒐集資料的方式對調查過程的質量控制有一定難度3對於敏感問題,被訪者會有壓力。
**式;優點:1速度快2對調查員比較安全3對訪問過程的控制比較容易。缺點:1實施地區有限2調查時間不能過長3使用的問卷要簡單4被訪者不願回答時,不易勸服。
3.3資料型資料的分組方法和步驟
分組方法:單變數值分組和組距分組,組距分組又分為等距分組和異距分組。分組步驟:1確定組數2確定各組組距3根據分組整理成頻數分布表
3.4直方圖和條形圖的區別
1條形圖使用圖形的長度表示各類別頻數的多少,其寬度固定,直方圖用面積表示各組頻數,矩形的高度表示每一組的頻數或頻率,寬度表示組距,2直方圖各矩形連續排列,條形圖分開排列,3條形圖主要展示分類資料,直方圖主要展示數值型資料。
3.7莖葉圖比直方圖的優勢,他們各自的應用場合
莖葉圖既能給出資料的分布情況,又能給出每乙個原始資料,即保留了原始資料的資訊。在應用方面,直方圖通常適用於大批量資料,莖葉圖適用於小批量資料。
3.8鑑別圖示優劣的準則
(1)一張好圖應當精心設計,有助於洞察問題的實質
(2)一張好圖應當使複雜的觀點得到簡明、確切、高效的闡述
(3)一張好圖應當能在最短的時間內以最少的筆墨給讀者提供最大的資訊(4)一張好圖應當是多維的
(5)一張好圖應當表述資料的真實情況
4.5簡述眾數、中位數和平均數的特點和應用場合。
眾數是一組資料分布的峰值,不受極端值的影響,缺點是具有不唯一性。眾數只有在資料量較多時才有意義,資料量較少時不宜使用。主要適合作為分類資料的集中趨勢測度值。
中位數是一組資料中間位置上的代表值,不受極端值的影響。當資料的分布偏斜較大時,使用中位數也許不錯。主要適合作為順序資料的集中趨勢測度值。
平均數對數值型資料計算的,而且利用了全部資料資訊,在實際應用中最廣泛。當資料呈對稱分布或近似對稱分布時,****值相等或相近,此時應選擇平均數。但平均數易受極端值的影響,對於偏態分布的資料,平均數的代表性較差,此時應考慮中位數或眾數。
4.6簡述異眾比率、四分位差、方差或標準差的適用場合
對於分類資料,主要用異眾比率來測量其離散程度;對於順序資料,雖然也可以計算異眾比率,但主要使用四分位差來測量其離散程度;對於數值型資料,雖然可以計算異眾比率和四分位差,但主要使用方差或標準差來測量其離散程度。
4.8為什麼要計算離散係數?
方差和標準差是反映資料分散程度的絕對值,一方面其數值大小受原變數值本身水平高低的影響,也就是與變數的平均數大小有關;另一方面,它們與原變數的計量單位相同,採用不同計量單位的變數值,其離散程度的測度值也就不同。因此,為消除變數值水平高低和計量單位不同對離散程度測度值的影響,需要計算離散係數。
7.2評價估計量的標準:
無偏性:估計量抽樣分布的數學期望等於被估計的總體引數
有效性:對同一總體引數的兩個無偏點估計量,有更小標準差的估計量更有效一致性:隨著樣本容量的增大,估計量的值越來越接近被估計的總體引數
7.3置信區間:
由樣本統計量所構造的總體引數的估計區間
7.6獨立樣本和匹配樣本含義
獨立樣本:如果兩個樣本是從兩個總體中獨立抽取的,即乙個樣本中的元素與另乙個樣本中的元素相互獨立。
匹配樣本:乙個樣本中的資料與另乙個樣本中的資料相對應。
7.8簡述樣本量與置信水平,總體方差,估計誤差的關係?
樣本量越大置信水平越高,總體方差和邊際誤差越小
8.1假設檢驗和引數估計有什麼相同點和不同點?
答:引數估計和假設檢驗是統計推斷的兩個組成部分,它們都是利用樣本對總體進行某種推斷,然而推斷的角度不同。引數估計討論的是用樣本統計量估計總體引數的方法,總體引數μ在估計前是未知的。
而在引數假設檢驗中,則是先對μ的值提出乙個假設,然後利用樣本資訊去檢驗這個假設是否成立
第10章思考題
10.4方差分析中有哪些基本假定?
答:方差分析中有三個基本假定:(1)每個總體都應服從正態分佈
(2)各個總體的方差σ2
必須相同(3)觀測值是獨立的
10.5簡述方差分析的基本思想。
答:它是通過對資料誤差**的分析來判斷不同總體的均值是否相等,進而分析自變數對因變數是否有顯著影響。
10.9簡述方差分析的基本步驟。
答:(1)提出假設(一般提法形式如下:h0:
μ1=μ2=μ3==μi=.μk,自變數對因變數沒有顯著影響,h1:μi(i=1,2,3..
,k)不全相等,自變數對因變數有顯著影響)
(2)構造檢驗統計量(包括:計算各樣本的均值,計算全部觀測值的總均值,計算各誤差平方和,計算統計量)(3)統計決策。(將統計量的值f與給定的顯著性水平的臨界值f 進行比較,作出對原假設h0的決策)
統計學考試重點
一.題型分布 1.單選 x15 每個一分 2.多選x5 每個兩分,少選得一分,多選不得分 3.判斷x10 每個一分 4.填空x10 每個一分 5.計算題x4 總分55分,計算題分別出自五 六 八 十章 二.考試重點 1.考試重點章節為 四 五 六 八 十章,其它章節的題目主要分布在單選多選判斷與填空...
統計學考試試卷 B
6 某企業某產品的銷售 是去年的98 則該指數是 b 個體指數 d 質量指標指數 d 動態指數 四 計算題 1 某個負責人欲估計600根零件的長度,隨機抽取36根,測驗得其平均長度為21.4mm,樣本標準差為0.15mm,試求總體均值的置信度為95 的置信.區間?12分 2 有6個女學生的身高與體重...
統計學複習
例1 某廠計畫完成工業增加值200萬元,實際完成220萬元,則 例2 3月份的計畫生產成本為100萬元,實際生產成本為120萬元,則其計畫完成相對數為 例5 某廠計畫2000年勞動生產率要比上年提高4 實際提高5 則 例6 某企業計畫產品單位成本比上年降低5 實際降低6 則 例7 某工廠在2005年...