SPSS常用分析方法操作步驟(電子蟲桑)
第一章 均值比較檢驗(yàn)與方差分析
在經(jīng)濟(jì)社會(huì)問題的研究過程中,常常需要比較現(xiàn)象之間的一些指標(biāo)有無顯著差異spss相關(guān)分析有什么用,特別當(dāng)考察的樣本容量n比較大時(shí),由隨機(jī)變量的中心極限定理知,樣本均值近似他服從正態(tài)分布、所以,均值的比較檢驗(yàn)主要研究關(guān)于正態(tài)總體則均值有關(guān)的假設(shè)是否成立的問題。
本章主要內(nèi)容:
1.單個(gè)總體均值的t檢驗(yàn)(One- T Test);
2.兩個(gè)獨(dú)立總樣本均值的I檢驗(yàn)(- T Test );
3.兩個(gè)有聯(lián)系總體均值的t檢驗(yàn)(- T Test );
4.單因素方差分析(0ne-Way ANOVA);
5.雙因素方差分析( Model→)。
假設(shè)條件:研究的數(shù)據(jù)服從正態(tài)分布或近似地服從正態(tài)分布。
在菜單中,均值比較檢驗(yàn)可以從菜單 Means 和 Model得出。
第一節(jié) 單個(gè)總體均值的t檢驗(yàn)(One- T Test)
單個(gè)總體的t檢驗(yàn)也稱為單一樣本的t檢驗(yàn),也就是檢驗(yàn)單個(gè)變量的均值是否與假定的均值之間存在差異。將單個(gè)變量的樣本均值與假定的常數(shù)相比較,通過檢驗(yàn)得出預(yù)先的假設(shè)是否正確的結(jié)論。
例2.1 根據(jù)2002年我國(guó)不同行業(yè)的工資水平,檢驗(yàn)國(guó)有企業(yè)的職工平均年工資收入是否等于10000元,假設(shè)數(shù)據(jù)近似地服從止態(tài)分布。
首先建立假設(shè):H0:國(guó)有企業(yè)工資為10000元。
H1:國(guó)有企業(yè)工資不等于10000元。
第二節(jié) 兩個(gè)總體的t檢驗(yàn) (Two- T Test)
一、兩個(gè)獨(dú)立樣本的t檢驗(yàn) ( - T Test)
- T Test是檢驗(yàn)兩個(gè)沒有聯(lián)系的總體樣本均值間是否存在顯著的差異,兩個(gè)沒有聯(lián)系的總體樣也稱獨(dú)立樣本,如兩個(gè)無聯(lián)系的企業(yè)生產(chǎn)的同樣產(chǎn)品之間的某項(xiàng)指標(biāo)的均值的比較,不同地區(qū)的兒童身高、體重的比較等,都可以通過抽取樣本檢驗(yàn)兩個(gè)總體的均值是否存在顯著的差異。 例2. 2 某醫(yī)藥研究所考察—種藥品對(duì)男性和女性的治療效果是否有顯著差異,調(diào)查了10名男性服用者及7名女性服用者,對(duì)他們服藥后的各項(xiàng)指標(biāo)進(jìn)行綜合評(píng)分,服用的效果越好,分值就越高,每人所得的總分見表2-2,試根據(jù)表中的數(shù)據(jù)檢驗(yàn)這種藥品對(duì)男性和女性的治療效果是否存在顯著差異。
解:由于男性和女性的樣本是無聯(lián)系的,所以這兩個(gè)樣本是相互獨(dú)立的??蓱?yīng)用兩獨(dú)立樣本的假設(shè)檢驗(yàn)。
首先,建立假設(shè)H0:該藥品對(duì)男性和女性的治療效果沒有顯著差異; H1:該藥品對(duì)男性和女性的治療效果有顯著差異。
二、兩個(gè)有聯(lián)系樣本均值的比較(- T Test )
- T Test是檢驗(yàn)兩個(gè)有聯(lián)系正態(tài)總體的均值是否存在顯著的差異,又稱配對(duì)樣本的T檢驗(yàn)。如檢驗(yàn)?zāi)撤N藥品使用的效果是否顯苦,需要對(duì)使用者使用前后進(jìn)行比較;再如對(duì)某種糧食進(jìn)行品種改良,也需要比較改良前后糧食產(chǎn)量有無顯著差異等。
例2.3 某企業(yè)對(duì)生產(chǎn)線上的工人進(jìn)行某種專業(yè)技術(shù)培訓(xùn),要對(duì)培訓(xùn)效果進(jìn)行檢驗(yàn),從參加培訓(xùn)的工人中抽取30人,將他們培訓(xùn)前后每加工500個(gè)零件的不合格品數(shù)進(jìn)行對(duì)比,得到數(shù)據(jù)表2-4。試根據(jù)表中數(shù)據(jù)檢驗(yàn)培訓(xùn)前后工人的平均操作技術(shù)水平是否有顯著提高,也就是檢驗(yàn)培訓(xùn)效果是否顯著。
解:這顯然是配對(duì)樣本均值的假設(shè)檢驗(yàn)的問題。所以要建立假設(shè): H0:培訓(xùn)前后工人的技術(shù)水平?jīng)]有顯著差異; H1:培訓(xùn)前后工人的技術(shù)水平有顯著差異;
第三節(jié) 單因素方差分析(One-Way ANOVA)
單因變量的單因素方差分析主要解決多于兩個(gè)總體樣本或變量間均值的比較問題。是一種對(duì)多個(gè)(大于兩個(gè))總體樣本的均值是否存在顯著差異的檢驗(yàn)方法。
單因素方差分析的應(yīng)用條件:在不同的水平(因素變量取不同值)下,各總體應(yīng)當(dāng)服從方差相等的正態(tài)分布。
例2.4 某企業(yè)需要一種零件,現(xiàn)有三個(gè)不同地區(qū)的企業(yè)生產(chǎn)的同種零件可供選擇,為了比較這三個(gè)零件的強(qiáng)度是否相同,每個(gè)企業(yè)抽出6件產(chǎn)品進(jìn)行強(qiáng)度測(cè)試,其值如表2-6所示。假設(shè)每個(gè)企業(yè)零件的強(qiáng)度只服從正態(tài)分,試檢驗(yàn)這三個(gè)地區(qū)企業(yè)的零件強(qiáng)度是否存在顯著差異。 解:首先建立假設(shè)H0:三個(gè)地區(qū)的零件強(qiáng)度無顯著差異; H1:三個(gè)地區(qū)的零件強(qiáng)度有顯著差異;
例2.5:某個(gè)年級(jí)有三個(gè)班,現(xiàn)在對(duì)他們的一次數(shù)學(xué)考試成績(jī)進(jìn)行隨機(jī)抽(見下表),試在顯著性水平0.005下檢驗(yàn)各班級(jí)的平均分?jǐn)?shù)有無顯著差異(數(shù)據(jù)文件:數(shù)學(xué)考試成績(jī).sav)。
(1)建立數(shù)學(xué)成績(jī)數(shù)據(jù)文件。
(2)選擇“分析” →“比較均值” →“單因素方差”,打開單因素方差分析窗口,將“數(shù)學(xué)成績(jī)”移入因變量列表框,將“班級(jí)”移入因子列表框。
(3)單擊“兩兩比較”按鈕,打開“單因素ANOVA兩兩比較”窗口。
(4)在假定方差齊性選項(xiàng)欄中選擇常用的LSD檢驗(yàn)法,在未假定方差齊性選項(xiàng)欄中選擇’s檢驗(yàn)法。在顯著性水平框中輸入0.05,點(diǎn)擊繼續(xù),回到方差分析窗口。
(5)單擊“選項(xiàng)”按鈕,打開“單因素ANOVA選項(xiàng)”窗口,在統(tǒng)計(jì)量選項(xiàng)框中勾選“描述性”和“方差同質(zhì)性檢驗(yàn)”。并勾選均值圖復(fù)選框,點(diǎn)擊“繼續(xù)”,回到“單因素ANOVA選項(xiàng)”窗口,點(diǎn)擊確定,就會(huì)在輸出窗口中輸出分析結(jié)果。
第四節(jié) 雙因素方差分析
單因變量的雙因素方差分析是對(duì)觀察的現(xiàn)象(岡變量)受兩個(gè)因素或變量的影響進(jìn)行分析,檢驗(yàn)不同水平組合之間對(duì)因變旦的影響足合顯著。雙因素方差分析的應(yīng)用范圍很廣,如糧食產(chǎn)量受到氣候、溫度因素的影響;共生物廣:艙的牛產(chǎn)過程不僅受催化劑多少的影響,還受溫度高低的影響等,甚至兩因素變雖之間的交互作用對(duì)因變量也有 定的影響。要分清楚哪個(gè)因素的影響作用比較大,就pJ以應(yīng)用雙因素方差分析的方法來解決。
例2.6:研究不同溫度與不同濕度對(duì)粘蟲發(fā)育歷期的影響,得試驗(yàn)數(shù)據(jù)如表5-7。分析不同溫度和濕度對(duì)粘蟲發(fā)育歷期的影響是否存在著顯著性差異(數(shù)據(jù)文件:粘蟲.sav)。
(1)建立數(shù)據(jù)文件“粘蟲.sav”。
(2)選擇“分析” →“一般線性模型” →“單變量”,打開單變量設(shè)置窗口。
(3)分析模型選擇:此處我們選用默認(rèn);
(4)比較方法選擇:在窗口中單擊“對(duì)比”按鈕,打開“單變量:對(duì)比”窗口進(jìn)行設(shè)置,單擊“繼續(xù)”返回
(5)均值輪廓圖選擇:?jiǎn)螕簟袄L制”按鈕,設(shè)置比較模型中的邊際均值輪廓圖,單擊 “繼續(xù)”返回;
(6)“兩兩比較”選擇,用于設(shè)置兩兩比較檢驗(yàn),本例中設(shè)置為“溫度”和
“濕度”。
第二章 相關(guān)分析與回歸模型的建立與分析
相關(guān)分析和回歸分析是統(tǒng)計(jì)分析方法中最重要內(nèi)容之一,是多元統(tǒng)計(jì)分析方法的基礎(chǔ)。相關(guān)分析和回歸分析主要用于研究和分析變量之間的相關(guān)關(guān)系,在變量之間尋求合適的函數(shù)關(guān)系式,特別是線性表達(dá)式。
本章主要內(nèi)容;
1.對(duì)變量之間的相關(guān)關(guān)系進(jìn)行分析()。其中包括簡(jiǎn)單相關(guān)分析()和偏相關(guān)分析()。
2.建立因變量和自變量之間的回歸模型(),其中包括線性回歸分析()和曲線估計(jì)(Curve )。
數(shù)據(jù)條件:參與分析的變量數(shù)據(jù)是數(shù)值型變量或有序變量。
第一節(jié) 相關(guān)方析 ()
兩個(gè)變量之間的相關(guān)關(guān)系稱簡(jiǎn)單相關(guān)關(guān)系。有兩種方法可以反映簡(jiǎn)單相關(guān)關(guān)系,一是散點(diǎn)圖,可直觀地顯示變量之間的關(guān)系,二是相關(guān)系數(shù),可準(zhǔn)確地反映兩變量的相關(guān)程度。
一、 簡(jiǎn)單相關(guān)分析
(一) 散點(diǎn)圖
SPSS軟件的繪圖命令集中在菜單。
(二) 簡(jiǎn)單相關(guān)分析操作
簡(jiǎn)單相關(guān)分析是指兩個(gè)變量之間的相關(guān)分析,主要指對(duì)兩變量之間的線性相關(guān)程度做出定量分析。
例3.6(簡(jiǎn)單雙變量):調(diào)查了29人身高、體重和肺活量的數(shù)據(jù)見下表,試分析這三者之間的相互關(guān)系。
(1)建立數(shù)據(jù)文件“學(xué)生生理數(shù)據(jù).sav”。
(2)選擇“分析” →“相關(guān)” →“雙變量”,打開雙變量相關(guān)分析對(duì)話框。
(3)選擇分析變量:將“身高”、“體重”和“肺活量”分別移入分析變量框中。
(4)選擇相關(guān)分析方法:在相關(guān)系數(shù)欄有三種相關(guān)系數(shù),分別對(duì)應(yīng)三種方法,供使用者選擇。
(5)顯著性檢驗(yàn):雙側(cè)檢驗(yàn)、單側(cè)檢驗(yàn)。
(6)“標(biāo)記顯著性檢驗(yàn)”復(fù)選項(xiàng):選中該復(fù)選項(xiàng),輸出結(jié)果中在相關(guān)系數(shù)右上角用“*”表示顯著性水平為5%,用“**”表示顯著水平為1%。
(7)“選項(xiàng)”對(duì)話框:本例在統(tǒng)計(jì)時(shí)項(xiàng)選擇“均值和標(biāo)準(zhǔn)差”,在缺失值選項(xiàng)選擇默認(rèn),即“按對(duì)排除個(gè)案”。
(三)偏相關(guān)分析
簡(jiǎn)單相關(guān)關(guān)系只反映兩個(gè)變量之間的關(guān)系,但如果因變量受到多個(gè)因素的影響時(shí),因變量與某一自變量之間的簡(jiǎn)單相關(guān)關(guān)系顯然受到其他相關(guān)因素的影響,不能真實(shí)地反映二者之間的關(guān)系,所以需要考察在其他因素的影響剔除后二者之間的相關(guān)程度,即偏相關(guān)分折。
第二節(jié) 線性生回歸分析()
線性回歸是統(tǒng)計(jì)分析方法小最常用的方法之一。如果所研究的現(xiàn)象有若干個(gè)影響因素,且這些因素對(duì)現(xiàn)象的綜合影響是線性的,則可以使用線件回歸的方法建立現(xiàn)象(因變量)與影響因素(自變量)之間的線性函數(shù)關(guān)系式。
一、線性回歸模型假設(shè)條件與模型的各種檢驗(yàn)
(二)線性回歸模型的檢驗(yàn)項(xiàng)目
1.回歸系數(shù)的檢驗(yàn)(T檢驗(yàn));
2.回歸方程的檢驗(yàn)(F檢驗(yàn));
3.?dāng)M合程度判定(可決系數(shù)R2);
4.D.W檢驗(yàn)(殘差項(xiàng)是否自相關(guān));
5.共線性檢驗(yàn)(多元線性回歸)。
6.殘差圖示分析(判斷殘差序列異方差性和自相關(guān))。
二、線性回歸分析的具體步驟
例3.10:考察中國(guó)居民收入與消費(fèi)支出的關(guān)系。數(shù)據(jù)文件名稱“居民消費(fèi)水平.sav”。 變量說明:GDPP:人均國(guó)內(nèi)生產(chǎn)總值 CONSP:人均居民消費(fèi)
(1)建立數(shù)據(jù)文件“居民消費(fèi)水平.sav”。
(2)選擇“分析” →“回歸” →“線性”,打開線性回歸分析對(duì)話框。
(3)選擇因變量和自變量:將人均居民消費(fèi)“CONSP” 移入因變量框中; (4)在線性回歸窗口中點(diǎn)擊“統(tǒng)計(jì)量”,打開線性回歸統(tǒng)計(jì)量窗口,對(duì)統(tǒng)計(jì)量進(jìn)行設(shè)置。
(5)在線性回歸窗口中點(diǎn)擊“繪制”,打開、“線性回歸:圖” 窗口,選擇繪制標(biāo)準(zhǔn)化殘差圖,其中的正態(tài)概率圖是圖。同時(shí)還需要畫出殘差圖,Y軸選擇:,X軸選擇: ZPRED。
(6)在線性回歸窗口中點(diǎn)擊“選項(xiàng)”,打開、“線性回歸:選項(xiàng)” 窗口。
◆ 步進(jìn)方法標(biāo)準(zhǔn)單選鈕組:設(shè)置納入和排除標(biāo)準(zhǔn),可按P值或F值來設(shè)置;
◆ 在等式中包含常量復(fù)選框:用于決定是否在模型中包括常數(shù)項(xiàng),默認(rèn)選中。
第三節(jié) 曲線估計(jì)(Curve )
上節(jié)介紹了線性回歸模型的分析和檢驗(yàn)方法。如果某對(duì)變量數(shù)據(jù)的散點(diǎn)圖不是直線,而是某種曲線的形式時(shí),可以利用曲線估計(jì)的方法為數(shù)據(jù)尋求一條合適的曲線,也可用變量代換的方法將曲線方程變?yōu)橹本€方程。用線性回歸模型進(jìn)行分析和預(yù)測(cè)。
第三章 時(shí)間序列分析
由于反映社會(huì)經(jīng)濟(jì)現(xiàn)象的大多數(shù)數(shù)據(jù)是按照時(shí)間順序記錄的,所以時(shí)間序列分析是研究社會(huì)經(jīng)濟(jì)現(xiàn)象的指標(biāo)隨時(shí)間變化的統(tǒng)計(jì)規(guī)律性的統(tǒng)計(jì)方法。為了研究事物在不同時(shí)間的發(fā)展?fàn)顩r,就要分析其隨時(shí)間的推移的發(fā)展趨勢(shì),預(yù)測(cè)事物在未來時(shí)間的數(shù)量變化。 本事主要內(nèi)容:
1.時(shí)間序列的線圖、自相關(guān)圖和偏自關(guān)系圖;
2.SPSS軟件的時(shí)間序列的分析方法——季節(jié)變動(dòng)分析。
第四章 非參數(shù)檢驗(yàn)
前面進(jìn)行的假設(shè)檢驗(yàn)和方差分析spss相關(guān)分析有什么用,大都是在數(shù)據(jù)服從正態(tài)分布或近似地服從正態(tài)分布的條件下進(jìn)行的。但是如果總體的分布未知,進(jìn)行總體參數(shù)的檢驗(yàn),或者檢驗(yàn)總體服從一個(gè)指定的分布,都可以歸結(jié)為非參數(shù)檢驗(yàn)方法。非參數(shù)檢驗(yàn)包括下列內(nèi)容:
1.總體分布的假設(shè)撿驗(yàn);
2.兩種以下的現(xiàn)象之間的關(guān)聯(lián)性檢驗(yàn)(見列聯(lián)分析);
3.總體分布未知時(shí),關(guān)于單個(gè)總體均值的檢驗(yàn);兩個(gè)總體均值或分布的差異是否顯著的檢驗(yàn),以及多個(gè)未知總體的單因素方差分析; 4.某種現(xiàn)象出現(xiàn)的隨機(jī)性檢驗(yàn)。
在SPSS分析軟件中,非參數(shù)檢驗(yàn)在在菜單共有8種檢驗(yàn)方法,這8種檢驗(yàn)方法依次是:
第二節(jié) 一個(gè)樣本的K—S檢驗(yàn)
一個(gè)樣本的K—S檢驗(yàn)又稱單個(gè)樣本柯爾莫哥洛夫 —— 斯米諾夫檢驗(yàn),這種檢驗(yàn)可以檢驗(yàn)樣本數(shù)據(jù)是否服從正態(tài)分布、泊松分布、均勻分布及指數(shù)分布四種分命形式。但一般要求在大樣本條件下進(jìn)行檢驗(yàn)。
一、SPSS常用多變量分析技術(shù)比較匯總表
注:卡方分析:定量?jī)蓚€(gè)定性變量的關(guān)聯(lián)程度
簡(jiǎn)單相關(guān)分析:計(jì)量?jī)蓚€(gè)計(jì)量變量的相關(guān)程度
獨(dú)立樣本T檢驗(yàn):比較兩組平均數(shù)是否相等
ANOVA:可以比較三組以上的平均數(shù)是否相等,并進(jìn)行多重比較檢驗(yàn)
:可以比較兩因素的平均數(shù)是否相等,并檢驗(yàn)主效應(yīng)和交互效應(yīng)
判別分析與回歸:應(yīng)用于檢驗(yàn)一組計(jì)量的自變量(可含虛擬變量)是否可以正確區(qū)別一個(gè)定性的因變量
多維量表法(MDS):試圖將個(gè)體中的變異數(shù)據(jù),經(jīng)過轉(zhuǎn)為為一個(gè)多維度的空間圖,且轉(zhuǎn)化的個(gè)體在空間中的相對(duì)關(guān)系仍與原始數(shù)據(jù)盡量配合一致。
二、SPSS常用統(tǒng)計(jì)技術(shù)(變量個(gè)數(shù)與測(cè)量量表)比較匯總表
注:理論模型中變量通常很難測(cè)量,這類變量稱為潛變量,如績(jī)效、滿意度、忠誠(chéng)度等。
PS:原本這篇想做一個(gè)SPSS學(xué)習(xí)大綱的,卻沒找到思維導(dǎo)圖軟件,只好在WORD上整理了匯總了一些SPSS常用的方法同時(shí)也整理了一個(gè)SPSS學(xué)習(xí)的大致框架。