一文教你做卡方擬合優(yōu)度檢驗(yàn)
一、什么時候用?
有這樣一種場景,總共收集100份數(shù)據(jù),其中男性為48個,女性為52個;在收集數(shù)據(jù)之前預(yù)期男女比例應(yīng)該是4:6 (40%為男性,60%為女性),那么預(yù)期的比例是否與實(shí)際的比例有著明顯的差異性呢?類似這類希望研究數(shù)據(jù)的實(shí)際比例與預(yù)期比例是否一致。則可以使用卡方擬合優(yōu)度檢驗(yàn)。
二、卡方擬合優(yōu)度檢驗(yàn)原理
卡方擬合優(yōu)度檢驗(yàn)是一種非參數(shù)檢驗(yàn)方法,其用于研究實(shí)際比例情況,是否與預(yù)期比例表現(xiàn)一致,它只針對于類別數(shù)據(jù)。
卡方擬合優(yōu)度檢驗(yàn)的原理在于通過計(jì)算實(shí)際頻數(shù)與預(yù)期頻數(shù)的差值,且對差值進(jìn)行平方,最終加和得到卡方值;然后通過卡方值計(jì)算得到p?值;如果說實(shí)際頻數(shù)與預(yù)期頻數(shù)差值特別大,則卡方值特別大,對應(yīng)的p?值也會特別小;因此檢驗(yàn)出來就會顯示有明顯的差異性;反之如果基本沒有差異,那么實(shí)際頻數(shù)和預(yù)期頻數(shù)之間差值很小,則卡方值很小,計(jì)算得到的p?值會很大,最終顯示沒有差異性。
以下通過一個案例數(shù)據(jù)說明使用SPSSAU-數(shù)據(jù)分析工具如何快速完成卡方擬合優(yōu)度檢驗(yàn)。
三、SPSSAU進(jìn)行卡方擬合優(yōu)度檢驗(yàn)
1、案例背景
當(dāng)前共收集100份數(shù)據(jù),其中男性為48個,女性為52個。在收集數(shù)據(jù)之間已經(jīng)預(yù)計(jì)好男性比例為4:6,當(dāng)前希望用卡方擬合優(yōu)度進(jìn)行檢驗(yàn),以判定收集數(shù)據(jù)的分布是否與預(yù)期保持一致。收集數(shù)據(jù)最終匯總?cè)缦卤恚?/p>

特別提示
卡方擬合優(yōu)度檢驗(yàn)共適用兩種數(shù)據(jù)格式,分別是‘加權(quán)格式’和‘不加權(quán)格式’;
上表為‘加權(quán)格式’,即單獨(dú)用一列表示各項(xiàng)的數(shù)量,稱為‘加權(quán)權(quán)重’,如果僅用一列表示數(shù)據(jù),即100個數(shù)據(jù)即為100行,則為‘不加權(quán)格式’,也即原始數(shù)據(jù)格式。
加權(quán)數(shù)據(jù)和原始數(shù)據(jù)格式的說明:SPSSAU:什么是加權(quán)格式數(shù)據(jù),什么是不加權(quán)格式數(shù)據(jù)(原始數(shù)據(jù))?
2、操作
本例子使用‘加權(quán)數(shù)據(jù)’格式,并且希望的男女比例分別是4:6,操作截圖如下:


關(guān)于期望比例設(shè)置上,可以設(shè)置成4和6;也可以寫成0.4和0.6,也或者寫成40和60均可;總之可以表達(dá)出相對比例均可,SPSSAU會自動進(jìn)行‘歸一化’計(jì)算。
3、SPSSAU輸出結(jié)果
SPSSAU共輸出表格和圖形,具體如下:

4、智能文字分析

所以,男女的實(shí)際頻數(shù)分別是48和52,但預(yù)期分別是40和60;經(jīng)過卡方擬合優(yōu)度檢驗(yàn)顯示,實(shí)際比例和期望比例并沒有呈現(xiàn)出顯著性差異(χ2=2.667,p?=0.102>0.05),意味著實(shí)際情況與期望情況基本一致,無明顯的差異性。而且可以結(jié)合圖形進(jìn)行觀察,也顯示實(shí)際情況與期望情況區(qū)別很小,無統(tǒng)計(jì)學(xué)上的差異性。
5、圖表可視化


注意:
如果不設(shè)置預(yù)期比例,SPSSAU默認(rèn)以各類別數(shù)據(jù)預(yù)期比例一致進(jìn)行分析。