spss操作程式
一、裝程式spss11.50
開啟光碟後,在一記事本檔案上找到乙個序號12345和兩個號碼。頭一空中可不填號碼。第二次出現空格時可以填寫的乙個號碼;按update後,再填第二個號碼。以下只要跟著走就行了。
二、定義變數:點選下方的variable view,以下定義:
1.變數名name:不多於8個字元。不能與spss的保留字相同(查書)。
2.變數型別type:預設型別為標準數值型numeric。
一般採用此型。即使是類別型變數,其**也是數量型的。也可使用帶逗點的數值型(comma),整數部分用逗點分節;也可使用圓點數值型(dot),其小數點與分節點的使用正好互換;對於很小的或很大的數字可用科學計數法型(scientific notation)。
3.預設變數值的總長度width為8,也可改變。
4.小數字數(decimals),預設為2,也可改變。
變數標籤:對變數名的說明,可定義,也可不定義。gender
變數值標籤:適用於類別變數。點選該格後,在上空格中填寫1,在下空格中填寫「男」,點選add後,在下框**現「1=男」。
缺損值:點選該格後,預設為「no missing values」。若要定義缺損值,可選discrete missing values,在空格中可填寫3個離散缺損值,也可選擇乙個範圍,加乙個離散值。
8.定義變數顯示寬度column。第三步的長度實際是變數值的長度,本步還包括變數名的長度。如第三步定義的with不小於變數名的長度,此步可不操作。
9.對齊方式alignment
變數的測度型別。分為scale、ordinal、nominal三種,分別指等距變數或比率變數、等級變數、名義變數。通常也可讓其處於預設狀態。
三、變數的整理和轉換
(一)觀察量的排序
開啟資料視窗,data—sort cases—把作為排序資料的變數(稱為by變數)名送入到右邊的sort by 框中—選擇公升序排列(ascending)/降序排列(descending)—ok。結果是觀察量排列順序改變。【data05-01,如可按***公升序,按age降序】
(二)變數值排序
目的是給一組連續資料(觀察值)排序。(不同於(一),這裡是要把一組連續變數按其值的大小,變為等級變數)transform—rank cases—選擇乙個或數個變數名進入右邊的variable框中—如要按另一變數(如按性別變數)排序,則在by後的框中調入變數名稱—在assign rank 1 to欄中選擇smallest value(最小數為第1等級)/largest value(最大數為第1等級)—點選ties,從四中選一,目的是處理相等資料的排序問題,其中mean是預設值,是常用的方法。結果是原變數值保持,新增變數名為原變數名前加r。
【盧data05-02】
(三)將原變數值以標準分數儲存起來
analyze—description statistics—description—s**e standardized values as variables.(不用定義變數名)【盧data09-02,選擇其中任何變數】
(四)將連續變數離散化
將連續變數離散化也可視作變數轉換:如果要將變數pcgnp按其值分為四類,可以這樣操作:transform— recode—into same variables(新變數值替代原變數值)/into different variables(原變數值仍保留)
將欲離散化的變數名稱,用箭頭送入numeric variable 欄中,在output variable name欄中填上新變數的名稱—點change,點old and new values—可點黑range,填上起至數值,又在new value中填上對應的數值,點add.【郭t2-2】
(五)根據已存在的變數建立新變數
如需要把已有變數pcgnp,變為它的自然對數lnpcgnp.可以利用spss函式(共有100多種)。開啟資料後,點選transform—compute—個目標變數(target variable)取乙個名字—選擇一種函式,送入上面的空框內,把原變數送入右邊的函式後的括號內—點選ok.
【郭t2-2,自然對數符號為ln(numexpr)】
(六)利用已有變數的部分資料增加乙個新變數
如把4個民族中的某個民族獨立成乙個組,對之作統計:
開啟檔案—data—select cases—if condition is satisfied—if—點選依據的變數—鍵入=(>)(<)x(x為定值)—ok【】
(七)插入新變數
在已錄入的資料表中某變數前插入新變數:於某變數處—點右鍵—insert variables,插入新案例,可妨此。
四、explore**過程
用於**一組資料的分布狀況,可得到箱線圖、莖葉圖、奇異值、直方圖、正態分佈檢驗圖、方差齊性檢驗。操作為:
analyze—descriptive statistics—explore—將待分析變數調入dependent list中—將分組變數(如果要按性別分男女**資料)送入factor list中(如無必要對資料分組探索,則不作此項選擇)—在display中選擇both(輸出圖形與統計量)/statistics(只輸出統計量)/plot(只輸出圖形),再在statistics/plots/option中作相應選擇—ok.【盧data09-03】
五、頻數分布frequencies
(一)一維頻數分布
1.開啟資料視窗後:analyze—descriptive—frequencies
2.從左框中選擇乙個或幾個變數名到variable視窗中。
3.顯示頻數分布表display frequencies tables是預設狀態,如不須頻數分布表,可取消此項。
4.在統計量statistics/圖形型別chart/輸出格式format三項中進行選擇。
(1)選擇所需的統計量
★選擇百分位陣列percentile:重要的有四分位數quartiles(25/50/75百分位數)及其他;
★選擇集中趨勢量central tendency:mean(平均數)/median(中位數)/mode(眾數)/sum(總和);
★選擇離中趨勢量dispersion:std. deviation/variance/range/minimum/
maximum/
★分布形態distribution : skewness(偏度,為正時,是正偏態分布,當此值大於1時,可以肯定不是正態分佈)/kurtosis(峰度,為正時,比標準正態分佈更尖銳;為負時,比標準正態分佈更低平;標準正態分佈的此值為0)。兩值均接近於零時,則更接近於標準正態分佈。
(2)選擇所需圖形;bar charts(條形圖)/pie charts(圓圖)/histograms(直方圖) (附有with normal curve,帶正態分佈曲線的直方圖)/none(不輸出圖形);
(3)輸出格式
輸出中有order by排序組,即按變數值公升序排列、降序排列;按頻數公升序排列、降序排列。有page format頁面格式組。【盧data09-01,把最高受教育年限educ和年齡age送入variable欄中,這兩個變數是各自獨立的,即對這兩個變數分別作頻數分析】
(二) 二維或多維頻數分布
1.交叉表(特別是在變數為類別變數時,得到的交叉表適合與卡方檢驗)
在開啟資料視窗的條件下—descriptive statistics—crosstabs—選乙個變數在行變數(row)—選乙個變數作列變數(column)—ok。
如果變數為連續變數,有需要作交叉表,則要求先對變數作離散化處理。例如如果要選擇工資作交叉表的變數之一,則應點選record,然後把工資按小於200,201-400,401-600……等分組。
2.可以利用layer及next/previous使變數間建立不同的層次。(見他條)
3.對上述交叉表可以進行卡方檢驗,也可求出列聯相關係數:在上述條件下:
statistics—chi-squere. 【盧data09-01,以childs(兒童數量)為列變數,送入row中,以occcat80(80年的職業種類)為行變數,送入column中,以region為第一層控制變數,送入layer中;最好先不分層,注意所選的變數都為類別變數】
六、相關分析
相關分析correlation下面有三個子命令:bivariate(兩變數的相關係數)/partial(偏相關)/distance(相似性測度)。
(一) bivariate相關分析:只要把變數名調入(兩個或多個)即可計算相關係數。只是要根據資料性質選擇用那種相關:
pearson相關/kendall』s tau-b/spearman.
2.當事先不知道相關方向時選擇雙尾檢驗;當事先已知相關方向時選擇單尾檢驗。
3.在option對話方塊中可以均值、標準差;也可以選擇叉積離差矩陣和協方差矩陣。(僅當計算pearson相關時) 【盧data09-03,把起始工資salbeging/現工資salary/受教育年限educ/年齡age/工作經驗(月數)jobtime/工作職務等級prevexp等送入vareable欄中,選擇pearson相關】
(二)partial偏相關分析
只需把欲求相關的變數送入variable中,把控制變數名送入controlling中即可。【盧data10-04,控制體重weight,求身高height與肺活量vcp的偏相關。同時對照求身高和肺活量的相關】
七、means過程
由analyze—compare means -means進入means過程。他可以計算有關變數的多項集中趨勢量數和離散趨勢量數。與discriptive過程不同的是,它必須分組求均值,因其目的在於均值比較。
故有因變數與自變數之分。
(一)基本操作
將乙個或多個因變數(要分析的變數)送入dependent list框中;將自變數送入 independent list框中。
(二)自變數的分層
1.兩個自變數放在第一層的操作
將兩個變數(如:***,2個水平;age.3個水平)依次送入independent list框中,控制層(位於兩框之間)顯示layer 1 of 1
此時顯示5個分組的描述統計量(同層自變數的水平相加)
上機操作要點
大家閱讀一下,幫我補充一下 考試有三大類題目 1 新建指定位置及名稱的空資料庫,並在此資料庫中新增表。2 開啟非空的已存資料庫,並對其中的某張資料表增加記錄。3 開啟非空的已存資料庫,並對其中的某幾張資料表建立關係 一類題目步驟 1 點選題目下方的資料庫圖示,啟動access程式,選擇 空資料庫 2...
spss加權方法
spss問卷資料加權 舉例說明 要求男女比例為6 4,而調查問卷中比例為7 3。為了使調查結果貼近真實情況,首先需要對問卷進行加權,讓問卷的分布結構與實際分不一致。首先我們需要對會員資料統計後發現男女比例為6 4,且男女會員的教育水平在分檔1 2 3 4的佔比為2 2 4 2.由此我們可以知道,各部...
SPSS使用簡介
第一章 spss10.0 for windows簡介 spss軟體是由美國spss公司研製的。spss的全稱為statistical program for social sciences,即 社會科學統計程式 spss10.0 for windows是在windows作業系統下執行的社會科學統計軟...