SPSS操作要點

2022-12-13 17:54:04 字數 4878 閱讀 1901

spss操作程式

一、裝程式spss11.50

開啟光碟後,在一記事本檔案上找到乙個序號12345和兩個號碼。頭一空中可不填號碼。第二次出現空格時可以填寫的乙個號碼;按update後,再填第二個號碼。以下只要跟著走就行了。

二、定義變數:點選下方的variable view,以下定義:

1.變數名name:不多於8個字元。不能與spss的保留字相同(查書)。

2.變數型別type:預設型別為標準數值型numeric。

一般採用此型。即使是類別型變數,其**也是數量型的。也可使用帶逗點的數值型(comma),整數部分用逗點分節;也可使用圓點數值型(dot),其小數點與分節點的使用正好互換;對於很小的或很大的數字可用科學計數法型(scientific notation)。

3.預設變數值的總長度width為8,也可改變。

4.小數字數(decimals),預設為2,也可改變。

變數標籤:對變數名的說明,可定義,也可不定義。gender

變數值標籤:適用於類別變數。點選該格後,在上空格中填寫1,在下空格中填寫「男」,點選add後,在下框**現「1=男」。

缺損值:點選該格後,預設為「no missing values」。若要定義缺損值,可選discrete missing values,在空格中可填寫3個離散缺損值,也可選擇乙個範圍,加乙個離散值。

8.定義變數顯示寬度column。第三步的長度實際是變數值的長度,本步還包括變數名的長度。如第三步定義的with不小於變數名的長度,此步可不操作。

9.對齊方式alignment

變數的測度型別。分為scale、ordinal、nominal三種,分別指等距變數或比率變數、等級變數、名義變數。通常也可讓其處於預設狀態。

三、變數的整理和轉換

(一)觀察量的排序

開啟資料視窗,data—sort cases—把作為排序資料的變數(稱為by變數)名送入到右邊的sort by 框中—選擇公升序排列(ascending)/降序排列(descending)—ok。結果是觀察量排列順序改變。【data05-01,如可按***公升序,按age降序】

(二)變數值排序

目的是給一組連續資料(觀察值)排序。(不同於(一),這裡是要把一組連續變數按其值的大小,變為等級變數)transform—rank cases—選擇乙個或數個變數名進入右邊的variable框中—如要按另一變數(如按性別變數)排序,則在by後的框中調入變數名稱—在assign rank 1 to欄中選擇smallest value(最小數為第1等級)/largest value(最大數為第1等級)—點選ties,從四中選一,目的是處理相等資料的排序問題,其中mean是預設值,是常用的方法。結果是原變數值保持,新增變數名為原變數名前加r。

【盧data05-02】

(三)將原變數值以標準分數儲存起來

analyze—description statistics—description—s**e standardized values as variables.(不用定義變數名)【盧data09-02,選擇其中任何變數】

(四)將連續變數離散化

將連續變數離散化也可視作變數轉換:如果要將變數pcgnp按其值分為四類,可以這樣操作:transform— recode—into same variables(新變數值替代原變數值)/into different variables(原變數值仍保留)

將欲離散化的變數名稱,用箭頭送入numeric variable 欄中,在output variable name欄中填上新變數的名稱—點change,點old and new values—可點黑range,填上起至數值,又在new value中填上對應的數值,點add.【郭t2-2】

(五)根據已存在的變數建立新變數

如需要把已有變數pcgnp,變為它的自然對數lnpcgnp.可以利用spss函式(共有100多種)。開啟資料後,點選transform—compute—個目標變數(target variable)取乙個名字—選擇一種函式,送入上面的空框內,把原變數送入右邊的函式後的括號內—點選ok.

【郭t2-2,自然對數符號為ln(numexpr)】

(六)利用已有變數的部分資料增加乙個新變數

如把4個民族中的某個民族獨立成乙個組,對之作統計:

開啟檔案—data—select cases—if condition is satisfied—if—點選依據的變數—鍵入=(>)(<)x(x為定值)—ok【】

(七)插入新變數

在已錄入的資料表中某變數前插入新變數:於某變數處—點右鍵—insert variables,插入新案例,可妨此。

四、explore**過程

用於**一組資料的分布狀況,可得到箱線圖、莖葉圖、奇異值、直方圖、正態分佈檢驗圖、方差齊性檢驗。操作為:

analyze—descriptive statistics—explore—將待分析變數調入dependent list中—將分組變數(如果要按性別分男女**資料)送入factor list中(如無必要對資料分組探索,則不作此項選擇)—在display中選擇both(輸出圖形與統計量)/statistics(只輸出統計量)/plot(只輸出圖形),再在statistics/plots/option中作相應選擇—ok.【盧data09-03】

五、頻數分布frequencies

(一)一維頻數分布

1.開啟資料視窗後:analyze—descriptive—frequencies

2.從左框中選擇乙個或幾個變數名到variable視窗中。

3.顯示頻數分布表display frequencies tables是預設狀態,如不須頻數分布表,可取消此項。

4.在統計量statistics/圖形型別chart/輸出格式format三項中進行選擇。

(1)選擇所需的統計量

★選擇百分位陣列percentile:重要的有四分位數quartiles(25/50/75百分位數)及其他;

★選擇集中趨勢量central tendency:mean(平均數)/median(中位數)/mode(眾數)/sum(總和);

★選擇離中趨勢量dispersion:std. deviation/variance/range/minimum/

maximum/

★分布形態distribution : skewness(偏度,為正時,是正偏態分布,當此值大於1時,可以肯定不是正態分佈)/kurtosis(峰度,為正時,比標準正態分佈更尖銳;為負時,比標準正態分佈更低平;標準正態分佈的此值為0)。兩值均接近於零時,則更接近於標準正態分佈。

(2)選擇所需圖形;bar charts(條形圖)/pie charts(圓圖)/histograms(直方圖) (附有with normal curve,帶正態分佈曲線的直方圖)/none(不輸出圖形);

(3)輸出格式

輸出中有order by排序組,即按變數值公升序排列、降序排列;按頻數公升序排列、降序排列。有page format頁面格式組。【盧data09-01,把最高受教育年限educ和年齡age送入variable欄中,這兩個變數是各自獨立的,即對這兩個變數分別作頻數分析】

(二) 二維或多維頻數分布

1.交叉表(特別是在變數為類別變數時,得到的交叉表適合與卡方檢驗)

在開啟資料視窗的條件下—descriptive statistics—crosstabs—選乙個變數在行變數(row)—選乙個變數作列變數(column)—ok。

如果變數為連續變數,有需要作交叉表,則要求先對變數作離散化處理。例如如果要選擇工資作交叉表的變數之一,則應點選record,然後把工資按小於200,201-400,401-600……等分組。

2.可以利用layer及next/previous使變數間建立不同的層次。(見他條)

3.對上述交叉表可以進行卡方檢驗,也可求出列聯相關係數:在上述條件下:

statistics—chi-squere. 【盧data09-01,以childs(兒童數量)為列變數,送入row中,以occcat80(80年的職業種類)為行變數,送入column中,以region為第一層控制變數,送入layer中;最好先不分層,注意所選的變數都為類別變數】

六、相關分析

相關分析correlation下面有三個子命令:bivariate(兩變數的相關係數)/partial(偏相關)/distance(相似性測度)。

(一) bivariate相關分析:只要把變數名調入(兩個或多個)即可計算相關係數。只是要根據資料性質選擇用那種相關:

pearson相關/kendall』s tau-b/spearman.

2.當事先不知道相關方向時選擇雙尾檢驗;當事先已知相關方向時選擇單尾檢驗。

3.在option對話方塊中可以均值、標準差;也可以選擇叉積離差矩陣和協方差矩陣。(僅當計算pearson相關時) 【盧data09-03,把起始工資salbeging/現工資salary/受教育年限educ/年齡age/工作經驗(月數)jobtime/工作職務等級prevexp等送入vareable欄中,選擇pearson相關】

(二)partial偏相關分析

只需把欲求相關的變數送入variable中,把控制變數名送入controlling中即可。【盧data10-04,控制體重weight,求身高height與肺活量vcp的偏相關。同時對照求身高和肺活量的相關】

七、means過程

由analyze—compare means -means進入means過程。他可以計算有關變數的多項集中趨勢量數和離散趨勢量數。與discriptive過程不同的是,它必須分組求均值,因其目的在於均值比較。

故有因變數與自變數之分。

(一)基本操作

將乙個或多個因變數(要分析的變數)送入dependent list框中;將自變數送入 independent list框中。

(二)自變數的分層

1.兩個自變數放在第一層的操作

將兩個變數(如:***,2個水平;age.3個水平)依次送入independent list框中,控制層(位於兩框之間)顯示layer 1 of 1

此時顯示5個分組的描述統計量(同層自變數的水平相加)

上機操作要點

大家閱讀一下,幫我補充一下 考試有三大類題目 1 新建指定位置及名稱的空資料庫,並在此資料庫中新增表。2 開啟非空的已存資料庫,並對其中的某張資料表增加記錄。3 開啟非空的已存資料庫,並對其中的某幾張資料表建立關係 一類題目步驟 1 點選題目下方的資料庫圖示,啟動access程式,選擇 空資料庫 2...

spss加權方法

spss問卷資料加權 舉例說明 要求男女比例為6 4,而調查問卷中比例為7 3。為了使調查結果貼近真實情況,首先需要對問卷進行加權,讓問卷的分布結構與實際分不一致。首先我們需要對會員資料統計後發現男女比例為6 4,且男女會員的教育水平在分檔1 2 3 4的佔比為2 2 4 2.由此我們可以知道,各部...

SPSS使用簡介

第一章 spss10.0 for windows簡介 spss軟體是由美國spss公司研製的。spss的全稱為statistical program for social sciences,即 社會科學統計程式 spss10.0 for windows是在windows作業系統下執行的社會科學統計軟...