13統計研究的程式與資料蒐集方法

2021-03-03 22:03:19 字數 3863 閱讀 3579

b、 什麼是資料蒐集:根據統計研究的目的和要求,有組織、有計畫地向調查物件蒐集原始資料和次級資料。

c、 資料**

指按照國家統一規定的各項要求,自下而上地定期向國家和主管部門報送基本統計資料的一種報告制度

優點:能保證統計資料的全面性和連續性

能保證統計資料的統一性和及時性

能滿足各級部門對統計資料的需要

缺點:統計報表過多會增加基層負擔

有可能由於虛報瞞報而影響統計資料質量

由於需要大量的人力、物力和財力,不宜經常進行

最近的一次普查:2023年第一次全國經濟普查

我國人口普查:2023年 2023年 2023年 2023年 2023年 2023年

(2)能夠保證樣本對總體的代表性,即樣本單位和總體具有相同的概率分布

(4)抽樣誤差可以事先計算並控制

優點:(1)能用較少的人力、物力和時間達到全面調查的目的

(2)調查資料的準確性較高、受人為干擾的可能性較小

方式:(1)簡單隨機抽樣,每個個體被抽中的機會相等;選擇乙個受試物件對其他元素沒有影響;使用隨機數表,抽籤等方式。

可以應用excel中的隨機函式rand()根據樣本框安排隨機樣本

*樣本框:抽樣過程中抽取樣本的所有抽樣單位的名單。如,從全體學生中,直接抽取200名學生作為樣本,那麼,全體學生的名單(花名冊)就是這次抽樣的樣本框。

例:在編號為1-100的學生中隨機抽取

隨機編號=int(rand()*100))+1

學會檢視excel的幫助檔案

(2)等距抽樣,又稱機械抽樣或系統抽樣,常用於**調查。

例如:從乙個學生人數為200人的總體中抽取容量為20的樣本,將學生的學號排序,假定隨機選取學號起點4,然後從總體中選取樣點的學號為第4,第14,第24,…

(3)型別抽樣,又稱分層抽樣,把總體某種分類標準分為若干群組,這些群組滿足互斥性、完備性、和相似性要求,然後在組中按照同樣的比例隨機選取樣本。

特點:代表性高,抽樣誤差低。

例如:調查物件按收入分為高、中、低三個層次,然後從每個階層中或隨機抽取

(4)整群抽樣,又稱聚類抽樣。先對總體分類,然後用簡單隨機抽樣選類,最後對選中的類作普查或簡單隨機抽樣調查。較為有效。

例如:按照家庭、宿舍樓或街區來抽取調查物件,對抽到的家庭、宿舍樓或街區再作全面或隨機調查。

3、非概率抽樣:不按照概率均等的原則,而是根據人們的主觀經驗或其它條件來抽取樣本。

缺點:(1)由於調查者的主觀決策影響抽樣的整個過程,因而不能保證樣本是否重現了總體的分布結構,樣本的代表性往往較小,用這樣的樣本推論總體是極不可靠的。

(2)誤差有時相當大,而且這種誤差又無法估計。

優點:(1)很多情況下,嚴格的隨機抽樣幾乎無法進行,例如調查物件的總體邊界不清而無法製作或提供抽樣框。

(2)有些研究為了符合研究的目的,不得不按照需要從總體中抽取少數有代表性的個體作為樣本。

(3)隨機抽樣的操作過程要求嚴格,實施起來比較麻煩,費時費力,因此如果調查的目的僅是對問題的初步探索,獲得研究的線索和提出假設,而不是由樣本推論總體,採用隨機抽樣就不一定是必須的。

綜上:操作方便、省錢省力,統計上也遠較概率抽樣簡單,而且若能對調查總體和調查物件有較好的了解,抽樣也可獲得相當的成功。

(1)典型調查

典型單位指在數量表現上具有普遍意義和代表性的總體單位,可以用來推斷總體的數量

這些單位數目不多,但其標誌值在總體標誌總量中占有較大比重,能反映總體的基本情況

能以較少的投入和較快的速度取得總體基本情況及變動趨勢的資料,但只適用於客觀存在著重點單位的情況

例如:對大型鋼鐵企業的調查可以了解全國鋼鐵的生產情況

對35個大中型城市的物價調查可以了解全國的物價狀況

(3)就近抽樣(偶遇抽樣、方便抽樣、自然抽樣)

定義:是指研究者根據現實情況,以自己方便的形式抽取偶然遇到的人作為調查物件,或者僅僅選擇那些離得最近的、最容易找到的人作為調查物件。

舉例:為了調查某市的交通情況,研究者到離他們最近的公共汽車站,把當時正在那裡等車的人選作調查物件。其他類似的偶遇抽樣還有:

在街口攔住過往行人進行調查;在圖書館閱覽室對當時正在閱讀的讀者進行調查;在商店門口、展覽大廳、電影院等公眾場所向進出往來的顧客、觀眾進行的調查;利用報刊雜誌向讀者進行調查;老師以他所教的班級的學生作為調查樣本的調查等等。

(4)目標式和判斷式抽樣(主觀抽樣、立意抽樣):

定義:調查者根據研究的目標和自己主觀的分析,來選擇和確定調查物件的方法。

研究者依據主觀判斷選取可以代表總體的個體作為樣本。樣本的代表性取決於研究者對總體的了解程度和判斷能力。

例如:在編制物價指數時,有關產品專案的選擇和樣本地區的決定等,常採用判斷抽樣。

(5)滾雪球抽樣:

定義:當我們無法了解總體情況時,可以從總體中的少數成員入手,對他們進行調查,向他們詢問還知道哪些符合條件的人;再去找那些人並詢問他們知道的人。如同滾雪球一樣,我們可以找到越來越多具有相同性質的群體成員。

例如,要研究退休老人的生活,可以清晨到公園去結識幾位散步老人,再通過他們結識其朋友。但是這種方法偏誤也很大,那些不好活動、不愛去公園、不愛和別人交往、喜歡乙個人在家裡活動的老人,你就很難把雪球滾到他們那裡去,而他們卻代表著另外一種退休後的生活方式。

滾雪球抽樣是在特定總體的成員難以找的時最適合的一種抽樣方法。譬如對獲得無家可歸者、流動勞工及非法移民等的樣本就十分適用。

(6)配額抽樣(定額抽樣):

它與分層抽樣中的比例抽樣相似,也是按調查物件的某種屬性或特徵將總體中所有個體分成若干類或層,然後在各層中抽樣,樣本中各層(類)所佔比例與他們在總體中所佔比例一樣。

進行定額抽樣時,研究者要盡可能的依據那些有可能影響研究變數的各種因素來對總體分層,並找出具有各種不同特徵的成員在總體中所佔的比例。然後依據這種劃分以及各類成員的比例去選擇調查物件,使樣本中的成員在上述各種因素、各種特徵方面的構成和在樣本的比例盡量接近總體情形。

例:假設某高校有2000名學生,其中男生佔60%,女生佔40%;文科學生和理科學生各佔50%;一年級學生佔40%,二年級、三年級、四年級學生分別佔30%、20%和10%。現要用定額抽樣方法依上述三個變數抽取乙個規模為100人的樣本。

依據總體的構成和樣本規模,我們可得到下列定額表:

配額抽樣和分層抽樣的區別:

a 分層抽樣總體進行分層時,通常依據的一種特徵或指標,分層的目的是為了照顧到某些比例小的層次,使得所抽樣本的代表性進一步提高,誤差進一步減小;而配額抽樣則是依據多個特徵,分層的目的是為了模擬出乙個總體

b 分層抽樣在每層進行抽樣時,按照一定的比例進行隨機抽樣;而配額抽樣則是根據每一層中分配的數額進行抽樣

c 分層抽樣完全根據概率原則,排除主觀因素,客觀地、等概率地到各層中進行抽樣;而配額抽樣則是「按事先規定地條件,有目的地尋找」樣本單位,在分層和抽樣的過程中有很多的人為因素影響

2、 中國統計資料

3、 經濟中國

4、 中國商業報告庫

google和百度也是常用的資料**

……特別提示:要學會使用學校圖書館的免費資料庫

財政學系09級碩士生曾穎同學常用的資料庫(詳細內容見網路平台中的課件「曾穎的資料庫」)

1、國研網資料庫

特點:統計資料庫包含巨集觀資料、金融、教育、行業資料等,但是巨集觀資料年度跨度不大。適合對個別指標進行跨省、跨時間的統一檢索。

另外有全文資料庫等,包含一些專家學者的文章,可以作為參考。

2、中經網

特點:以巨集觀資料為主,包含國家一級、31個省以及200多個市的資料,與國研網的統計資料庫類似,統計專案沒有國研網多,但是有些指標年份跨度更大。適合統一檢索。

3、資訊行

特點:非常全的資料庫,幾乎囊括了所有最新的年鑑。適合尋找資料的**。

缺點在於:沒有2023年之前的年鑑,資料不是**形式,需要自己修改。(可行的方法包括:

貼上到word中,把空白(^w)替換為製表符(^t),或者直接貼上到excel2007,進行資料分列)。

4、統計局資料庫

統計資料的收集 整理與描述

一 解答題 共20小題 1 2006秋?中山期末 設計調查問卷時,下列提問是否合適?如果不合適的話應該怎樣改進?1 你上學時使用的交通工具是 a 汽車 b 電單車 c 步行 d 其他 2 你對老師的教學滿意嗎?a 比較滿意 b 滿意 c 非常滿意 2 2014?秦淮區一模 為了了解甲 乙兩廠生產的電...

美國統計專業的就業前景與研究內容

有一些同學是申請美國統計學專業的,美國留學理工科專業的申請中,美國統計學專業的申請人非常多。在申請統計學專業前,學生首先應該了解統計學專業的研究方向以及就業前景等。本文主要為學生介紹了美國統計學專業的研究方向與美國統計學專業的就業方向,方便大家選專業申請。美國統計學專業的研究方向 統計學研究方向基礎...

基於音效卡的資料採集與分析系統的研究的中文翻譯

武漢工業學院 畢業設計 外文參考文獻譯文本 屆譯文出處 journal of coal science engineering china 畢業設計 題目基於音效卡的資料採集與分析系統的研究 院 系 機械工程系 專業名稱包裝工程 學生姓名 學生學號 指導教師唐善華 譯文要求 1 譯文內容須與課題 或...