「SPSSAU|數(shù)據(jù)分析」:主成分回歸案例分析
案例背景
1.案例說明
研究調(diào)查100家公司2010-2013年關(guān)于財務(wù)方面的具體數(shù)據(jù),這些財務(wù)指標(biāo)維度分別為盈利能力、償債能力、運(yùn)營能力、發(fā)展能力以及公司治理。其中每個維度分別有幾個分析項(xiàng),但是有些指標(biāo)是越大越好,有些指標(biāo)是越小越好。 需要在研究前進(jìn)行數(shù)據(jù)處理。
2.研究目的
利用償債能力、運(yùn)營能力、發(fā)展能力以及公司治理四個維度下的分析項(xiàng)進(jìn)行主成分分析以及判斷分析項(xiàng)與主成分之間的關(guān)系,利用得到的成分得分進(jìn)行命名作為線性回歸的自變量,用盈利能力下的三個指標(biāo)作為線性回歸的因變量,因?yàn)槊看尉€性回歸只能放入一個因變量所以重復(fù)進(jìn)行三次分析并且得到結(jié)論。
數(shù)據(jù)處理
主成分的目的就是用少數(shù)幾個成分去描述許多指標(biāo)或因素之間的聯(lián)系,即將相關(guān)比較密切的幾個變量歸在同一類中,每一類變量就成為一個成分(之所以稱其為成分,是因?yàn)樗遣豢捎^測的,即不是具體的變量),以最少的信息丟失為前提,以較少的幾個成分反映原資料的大部分信息。
在進(jìn)行主成分之前,由于所選取的指標(biāo)體系中每個指標(biāo)都有自己的量綱和變動差異性,這樣給綜合分析建模帶來不便,于是我們需要對收集得到的數(shù)據(jù)進(jìn)行預(yù)處理,以消除量綱和變動差異性的影響。通常對數(shù)據(jù)進(jìn)行的處理包括標(biāo)準(zhǔn)化處理(Z-score 法)、正向處理、均值化處理等。
此案例中有些指標(biāo)需要提前處理,具體指標(biāo)隸屬維度以及指標(biāo)性質(zhì)如下,比如資產(chǎn)負(fù)責(zé)率是逆向指標(biāo)可以進(jìn)行逆向化處理或者取倒數(shù);但是取倒數(shù)需要分析項(xiàng)的數(shù)據(jù)大于0,其他指標(biāo)需要正向化處理,公司治理的2個指標(biāo)可以做正向化處理也可以做適度化,比如認(rèn)為指標(biāo)不是越大越好也不是越小越好,接近于某個值或某個范圍內(nèi)認(rèn)為更好那就使用適度化,此案例中認(rèn)為越大越好處理為正向化(也有參考文獻(xiàn)做適度化處理,建議以參考文獻(xiàn)為主)。
首先用SPSSAU將分析項(xiàng)進(jìn)行“描述分析”觀察數(shù)據(jù)的基本情況。發(fā)現(xiàn)資產(chǎn)負(fù)債率所有數(shù)據(jù)均大于0,所以進(jìn)行處理時可以直接“取倒數(shù)”。
然后利用SPSSAU“數(shù)據(jù)處理”中的“生成變量”進(jìn)行指標(biāo)處理(一般正逆向化處理后不需要在進(jìn)行標(biāo)準(zhǔn)化處理,因?yàn)橐呀?jīng)正逆向化已經(jīng)處理了量綱問題,但是取倒數(shù)后需要進(jìn)行標(biāo)準(zhǔn)化處理)。
主成分結(jié)果
1.判斷分析項(xiàng)與主成分之間的關(guān)系
上表格針對主成分提取情況,以及主成分提取信息量情況進(jìn)行分析,從上表可知:主成分分析一共提取出4個主成分,特征根值均大于1,此4個主成分的方差解釋率分別是23.869%,17.700%,12.686%,10.842%,累積方差解釋率為65.097%。
成分與對應(yīng)項(xiàng)之間的關(guān)系:
一般情況下,如果13項(xiàng)與4個成分之間的對應(yīng)關(guān)系情況,與專業(yè)知識情況不符合,比如第一項(xiàng)被劃分到了第一個成分下面,此時則說明可能這項(xiàng)應(yīng)該被刪除處理,其出現(xiàn)了‘張冠李戴’現(xiàn)象。因而在進(jìn)行分析時很可能會對部分不合理項(xiàng)進(jìn)行刪除處理。除此之外,也有可能會出現(xiàn)‘糾纏不清’現(xiàn)象。
“張冠李戴”
一般情況下,如果13項(xiàng)與4個成分之間的對應(yīng)關(guān)系情況,與專業(yè)知識情況不符合,比如第一項(xiàng)被劃分到了第一個成分下面,此時則說明可能這項(xiàng)應(yīng)該被刪除處理,其出現(xiàn)了‘張冠李戴’現(xiàn)象。例如案例中的“每股經(jīng)營性現(xiàn)金流量”應(yīng)該屬于成分3是分析時被劃分到別的成分中。
“糾纏不清”
除了“張冠李戴”現(xiàn)象,有時候會出現(xiàn)‘糾纏不清’現(xiàn)象,比如案例中的“銷售現(xiàn)金比率”可歸屬為成分3,同時也可歸屬到成分4,這種情況較為正常(稱作‘糾纏不清’),需要結(jié)合實(shí)際情況處理即可,可將該項(xiàng)刪除,也可不刪除,這時,分析帶有一定主觀性。
Step1: 第一次分析
本例子中共13個分析項(xiàng),此13個分析項(xiàng)共分為4個維度,因此在分析前可主動告訴SPSSAU,此13項(xiàng)是四個維度,否則SPSSAU會自動判斷多少個成分 (通常軟件自動判斷與實(shí)際情況有很大出入,所以建議主動設(shè)置成分個數(shù))。如下圖:
上表格展示主成分對于研究項(xiàng)的信息提取情況,以及主成分和研究項(xiàng)對應(yīng)關(guān)系,從上表可知:針對共同度而言,共涉及MMS_應(yīng)收賬款周轉(zhuǎn)率,MMS_凈利潤增長率,MMS_主營業(yè)務(wù)收入增長率共3項(xiàng),說明主成分和研究項(xiàng)之間的關(guān)系非常薄弱,主成分不能有效的提取出研究項(xiàng)信息。因而應(yīng)該將此3項(xiàng)進(jìn)行刪除,刪除之后再次進(jìn)行分析。
Step2: 第二次分析
從上圖中可以看出:
“流動比率”、“速動比率”以及“資產(chǎn)負(fù)債率”這3項(xiàng),它們?nèi)繉?yīng)著成分1,公因子方差均高于0.4,說明此3項(xiàng)應(yīng)該同屬于一個維度,即邏輯上這3項(xiàng),并沒有出現(xiàn) “張冠李戴”現(xiàn)象。但是有出現(xiàn)“糾纏不清”的情況。
“第一大股東持股比”和“前十大股東持股比”共2項(xiàng),它們?nèi)繉?yīng)著成分2,但是二者出現(xiàn)“糾纏不清”的現(xiàn)象,考慮到此維度只剩下兩個維度所以暫不處理。
“總資產(chǎn)現(xiàn)金回收率”、“銷售現(xiàn)金比率”以及“每股經(jīng)營性現(xiàn)金流量”共3項(xiàng),當(dāng)他們對應(yīng)成分3, 其中“每股經(jīng)營性現(xiàn)金流量”出現(xiàn)“張冠李戴”進(jìn)行刪除處理。對于“糾纏不清”的情況保留觀察。
“存貨周轉(zhuǎn)率”、“總資產(chǎn)周轉(zhuǎn)率”它們對應(yīng)著成分4,但是二者出現(xiàn)“糾纏不清”的現(xiàn)象,考慮到此維度只剩下兩個維度所以暫不處理。
總結(jié)上述分析可知“每股經(jīng)營性現(xiàn)金流量”出現(xiàn)“張冠李戴”進(jìn)行刪除處理。而其他出現(xiàn)“糾纏不清”現(xiàn)象的,暫時不處理(進(jìn)行關(guān)注即可)。重新分析如下。
Step3: 第三次分析
將“每股經(jīng)營性現(xiàn)金流量”刪除后進(jìn)行分析如下:
從上圖可知
除了“流動比率”、“速動比率”以及“資產(chǎn)負(fù)債率”這3項(xiàng), “銷售現(xiàn)金比率”這一項(xiàng),其余的項(xiàng)均存在“糾纏不清”的現(xiàn)象,但考慮到成分下只余下兩項(xiàng),因而表示可以接受,主成分析分析結(jié)束。
2.KMO值和巴特球形檢驗(yàn)
使用主成分分析進(jìn)行信息濃縮研究,首先分析研究數(shù)據(jù)是否適合進(jìn)行主成分分析,從上表可以看出:KMO為0.614,大于0.6,滿足主成分分析的前提要求,意味著數(shù)據(jù)可用于主成分分析研究。以及數(shù)據(jù)通過Bartlett 球形度檢驗(yàn)(p<0.05),說明研究數(shù)據(jù)適合進(jìn)行主成分分析。
3.成分選擇個數(shù)
當(dāng)數(shù)據(jù)確定可以使用主成分分析后,下一步確定主成分成分選擇個數(shù)。
上表格針對主成分提取情況,以及主成分提取信息量情況進(jìn)行分析,從上表可知:主成分分析一共提取出4個主成分,特征根值均大于1,此4個主成分的方差解釋率分別是33.871%,20.571%,15.799%,13.779%,累積方差解釋率為84.021%。(提示:如果主成分提取個數(shù)與預(yù)期不符,可在分析時主動設(shè)置主成分個數(shù))。同時SPSSAU還提供了碎石圖幫助研究者判斷主成分提取個數(shù)。
4.提取成分
已經(jīng)確定了成分選擇個數(shù)經(jīng)過分析得到載荷系數(shù)矩陣如下:
從結(jié)果中可以看出,主成分1中反映“流動比率”、“速動比率”以及“資產(chǎn)負(fù)債率”共3個指標(biāo)的信息,它們主要反映了公司的償債能力。主成分2中反映了“第一大股東持股比”和“前十大股東持股比”共2項(xiàng),它們主要反映了公司治理能力,主成分3中反映了“存貨周轉(zhuǎn)率”、“總資產(chǎn)周轉(zhuǎn)率”共2項(xiàng),它們主要反映了公司運(yùn)營能力,主成分4中反映了“總資產(chǎn)現(xiàn)金回收率”、 “銷售現(xiàn)金比率”共兩項(xiàng),它們主要反映了公司發(fā)展能力。
整理表格如下:五個成分的名字分別叫F1償債能力、F2治理能力、F3運(yùn)營能力以及F4發(fā)展能力。
數(shù)據(jù)通過主成分分析得到四個維度,此案例的主要目的是研究上述四個維度對于公司盈利的影響,最終得到結(jié)論。將得到的成分得分利用SPSSAU標(biāo)題處理進(jìn)行命名,四個分析項(xiàng)作為線性回歸的自變量,盈利能力下的三個指標(biāo)作為因變量,重復(fù)進(jìn)行三次線性回歸,并進(jìn)行對結(jié)果描述,回歸結(jié)果描述分為兩大部分,一為中間分析過程,二為回歸分析結(jié)果。
主成分回歸結(jié)果
想要得到成分得分可以在分析前勾選“成分得分”按鈕,結(jié)束分析時SPSSAU單獨(dú)生成新標(biāo)題名稱類似為:“PCA****_score1”。研究者可通過【數(shù)據(jù)處理->標(biāo)題處理】對名稱進(jìn)行修改即可。:
F1償債能力、F2治理能力、F3運(yùn)營能力以及F4發(fā)展能力如下:
用得到的成分得分進(jìn)行命名作為線性回歸的自變量,用盈利能力下的三個指標(biāo)作為線性回歸的因變量,因?yàn)槊看尉€性回歸只能放入一個因變量所以重復(fù)進(jìn)行三次分析并且得到結(jié)論。SPSSAU線性回歸操作如下:
1.中間分析過程
(1)F檢驗(yàn)
從上表可以看出,離差平方和為1.068,殘差平方和為1.007,回歸平方和為0.061?;貧w方程的顯著性檢驗(yàn)中,統(tǒng)計量F=5.934,對應(yīng)的p值遠(yuǎn)遠(yuǎn)小于0.05,被解釋變量的線性關(guān)系是顯著的,可以建立模型。建立模型后,還需要進(jìn)一步查看模型的擬合優(yōu)度。
(2)擬合優(yōu)度
從上表可知,將償債能力、治理能力、運(yùn)營能力以及發(fā)展能力作為自變量,而將“凈資產(chǎn)收益率”作為因變量進(jìn)行線性回歸分析,從上表可以看出,模型R方值為0.057,調(diào)整R方為0.050,其中R方是決定系數(shù),模型擬合指標(biāo)。反應(yīng)Y的波動有多少比例能被X的波動描述。調(diào)整R方也是模型擬合指標(biāo)。當(dāng)x個數(shù)較多是調(diào)整R比R更為準(zhǔn)確。意味著償債能力、治理能力、運(yùn)營能力以及發(fā)展能力可以解釋凈資產(chǎn)收益率的5.7%變化原因。可見,模型擬合優(yōu)度較差,說明被解釋變量可以被模型解釋的部分較少。不過一般情況下只需要報告此值即可,不用過多關(guān)注其大小,原因在于多數(shù)時候我們更在乎X對于Y是否有影響關(guān)系即可。接下來查看變量是否具有多重共線性。
(3)多重共線性
VIF值用于檢測共線性問題,一般VIF值小于10即說明沒有共線性(嚴(yán)格的標(biāo)準(zhǔn)是5),有時候會以容差值作為標(biāo)準(zhǔn),容差值=1/VIF,所以容差值大于0.1則說明沒有共線性(嚴(yán)格是大于0.2),VIF和容差值有邏輯對應(yīng)關(guān)系,因此二選一即可,一般描述VIF值。在【線性回歸】分析時,SPSSAU會智能判斷共線性問題并且提供解決建議。 結(jié)果中可以看出,變量的VIF值均小于5,所以此案例不存在多重共線性的問題。
但是如果存在多重共線問題,建議三種解決方法一是使用逐步回歸分析(讓模型自動剔除掉共線性過高項(xiàng));二是使用嶺回歸分析(使用數(shù)學(xué)方法解決共線性問題),三是進(jìn)行相關(guān)分析,手工移出相關(guān)性非常高的分析項(xiàng)(通過主觀分析解決),然后再做線性回歸分析。
通過分析結(jié)果發(fā)現(xiàn)回歸分析的F檢驗(yàn)結(jié)果較好,并且模型模型擬合優(yōu)度良好能夠解釋大部分信息以及不存在多重共線性問題。接下來對回歸分析結(jié)果進(jìn)行描述并得出結(jié)論。
2.回歸分析結(jié)果
(1)模型公式
從上表可知,將發(fā)展能力,運(yùn)營能力,治理能力,償債能力作為自變量,而將MMS_凈資產(chǎn)收益率作為因變量進(jìn)行線性回歸分析,從上表可以看出,模型公式為:MMS_凈資產(chǎn)收益率=0.929 + 0.006*發(fā)展能力-0.004*運(yùn)營能力 + 0.008*治理能力 + 0.006*償債能力(對于此案例來說模型預(yù)測意義不大)。
(2)分析結(jié)果
對模型進(jìn)行F檢驗(yàn)時發(fā)現(xiàn)模型通過F檢驗(yàn)(F=5.934,p=0.000<0.05),也即說明發(fā)展能力,運(yùn)營能力,治理能力,償債能力中至少一項(xiàng)會對MMS_凈資產(chǎn)收益率產(chǎn)生影響關(guān)系,
發(fā)展能力的回歸系數(shù)值為0.006(t=2.308,p=0.022<0.05),意味著發(fā)展能力會對MMS_凈資產(chǎn)收益率產(chǎn)生顯著的正向影響關(guān)系。運(yùn)營能力的回歸系數(shù)值為-0.004(t=-1.592,p=0.112>0.05),意味著運(yùn)營能力并不會對MMS_凈資產(chǎn)收益率產(chǎn)生影響關(guān)系。治理能力的回歸系數(shù)值為0.008(t=3.309,p=0.001<0.01),意味著治理能力會對MMS_凈資產(chǎn)收益率產(chǎn)生顯著的正向影響關(guān)系。償債能力的回歸系數(shù)值為0.006(t=2.219,p=0.027<0.05),意味著償債能力會對MMS_凈資產(chǎn)收益率產(chǎn)生顯著的正向影響關(guān)系。
總結(jié)分析可知:發(fā)展能力, 治理能力, 償債能力會對MMS_凈資產(chǎn)收益率產(chǎn)生顯著的正向影響關(guān)系。但是運(yùn)營能力并不會對MMS_凈資產(chǎn)收益率產(chǎn)生影響關(guān)系。
(3)影響關(guān)系大小
如果說自變量X已經(jīng)對因變量Y產(chǎn)生顯著影響(P< 0.01),還想對比影響大小,建議可使用標(biāo)準(zhǔn)化系數(shù)( Beta)值的大小對比影響大小,Beta值大于0時正向影響,該值越大說明影響越大。Beta值小于0時負(fù)向影響,該值越小說明影響越大。發(fā)展能力, 治理能力, 償債能力會對MMS_凈資產(chǎn)收益率產(chǎn)生顯著的正向影響關(guān)系。三者標(biāo)準(zhǔn)化回歸系數(shù)分別為:0.113、0.162、0.108,可以看出模型中“治理能力”對“凈資產(chǎn)收益率”影響最大其次是“發(fā)展能力”。
通過分析發(fā)現(xiàn),其中四個自變量中有三個對于因變量有影響并且關(guān)系均為正向影響關(guān)系,其中“治理能力”對“凈資產(chǎn)收益率”影響最大。除了上述內(nèi)容外,SPSSAU還提供了因變量預(yù)測模型、簡化格式以及coefPlot,但是模型預(yù)測等在此次分析中并不是重點(diǎn)。
因變量預(yù)測模型
簡化格式
簡化格式只提供了回歸系數(shù)、95%CI以及VIF,其中一個“*”代表該項(xiàng)成0.05水平顯著,兩個“*”代表該項(xiàng)成0.01水平顯著。所以“治理能力”呈0.01水平顯著,“發(fā)展能力”與“償債能力”呈0.05水平顯著。
coefPlot
coefPlot展示具體的回歸系數(shù)值和對應(yīng)的置信區(qū)間,可直觀查看數(shù)據(jù)的顯著性情況,如果說置信區(qū)間包括數(shù)字0則說明該項(xiàng)不顯著,如果置信區(qū)間不包括數(shù)字0則說明該項(xiàng)呈現(xiàn)出顯著性。所以上圖中發(fā)展能力, 治理能力, 償債能力三個分析項(xiàng)的置信區(qū)間都不包括0,都呈現(xiàn)顯著性,運(yùn)營能力包括0,所以不顯著。
3.其它
其它兩個因變量與上述因變量描述過程相同,因?yàn)橹虚g過程等均滿足要求所以直接描述結(jié)論即可。
(1)因變量為“資產(chǎn)報酬率”的線性回歸結(jié)果
1)分析結(jié)果
對模型進(jìn)行F檢驗(yàn)時發(fā)現(xiàn)模型通過F檢驗(yàn)(F=24.629,p=0.000<0.05),也即說明發(fā)展能力,運(yùn)營能力,治理能力,償債能力中至少一項(xiàng)會對MMS_資產(chǎn)報酬率產(chǎn)生影響關(guān)系,發(fā)展能力的回歸系數(shù)值為0.031(t=5.374,p=0.000<0.01),意味著發(fā)展能力會對MMS_資產(chǎn)報酬率產(chǎn)生顯著的正向影響關(guān)系。運(yùn)營能力的回歸系數(shù)值為0.005(t=0.792,p=0.429>0.05),意味著運(yùn)營能力并不會對MMS_資產(chǎn)報酬率產(chǎn)生影響關(guān)系。治理能力的回歸系數(shù)值為0.035(t=6.035,p=0.000<0.01),意味著治理能力會對MMS_資產(chǎn)報酬率產(chǎn)生顯著的正向影響關(guān)系。償債能力的回歸系數(shù)值為0.033(t=5.708,p=0.000<0.01),意味著償債能力會對MMS_資產(chǎn)報酬率產(chǎn)生顯著的正向影響關(guān)系。
總結(jié)分析可知:發(fā)展能力, 治理能力, 償債能力會對MMS_資產(chǎn)報酬率產(chǎn)生顯著的正向影響關(guān)系。但是運(yùn)營能力并不會對MMS_資產(chǎn)報酬率產(chǎn)生影響關(guān)系。
2)影響關(guān)系大小
發(fā)展能力, 治理能力, 償債能力會對MMS_凈資產(chǎn)收益率產(chǎn)生顯著的正向影響關(guān)系。三者標(biāo)準(zhǔn)化回歸系數(shù)分別為:0.242、0.272、0.257,可以看出模型中“治理能力”對“凈資產(chǎn)收益率”影響最大其次是“償債能力”。
(2)因變量為“主營業(yè)務(wù)利潤率”的線性回歸結(jié)果
1)分析結(jié)果
對模型進(jìn)行F檢驗(yàn)時發(fā)現(xiàn)模型通過F檢驗(yàn)(F=29.795,p=0.000<0.05),也即說明發(fā)展能力,運(yùn)營能力,治理能力,償債能力中至少一項(xiàng)會對MMS_主營業(yè)務(wù)利潤率產(chǎn)生影響關(guān)系,發(fā)展能力的回歸系數(shù)值為0.007(t=2.122,p=0.034<0.05),意味著發(fā)展能力會對MMS_主營業(yè)務(wù)利潤率產(chǎn)生顯著的正向影響關(guān)系。
運(yùn)營能力的回歸系數(shù)值為-0.009(t=-2.463,p=0.014<0.05),意味著運(yùn)營能力會對MMS_主營業(yè)務(wù)利潤率產(chǎn)生顯著的負(fù)向影響關(guān)系。治理能力的回歸系數(shù)值為-0.000(t=-0.063,p=0.950>0.05),意味著治理能力并不會對MMS_主營業(yè)務(wù)利潤率產(chǎn)生影響關(guān)系。償債能力的回歸系數(shù)值為0.036(t=10.422,p=0.000<0.01),意味著償債能力會對MMS_主營業(yè)務(wù)利潤率產(chǎn)生顯著的正向影響關(guān)系。
總結(jié)分析可知:發(fā)展能力, 償債能力會對MMS_主營業(yè)務(wù)利潤率產(chǎn)生顯著的正向影響關(guān)系。以及運(yùn)營能力會對MMS_主營業(yè)務(wù)利潤率產(chǎn)生顯著的負(fù)向影響關(guān)系。但是治理能力并不會對MMS_主營業(yè)務(wù)利潤率產(chǎn)生影響關(guān)系。
2)影響關(guān)系大小
發(fā)展能力, 償債能力會對MMS_主營業(yè)務(wù)利潤率產(chǎn)生顯著的正向影響關(guān)系。以及運(yùn)營能力會對MMS_主營業(yè)務(wù)利潤率產(chǎn)生顯著的負(fù)向影響關(guān)系。三者標(biāo)準(zhǔn)化回歸系數(shù)分別為:0.094、-0.109、0.460,可以看出模型中“償債能力”對“主營業(yè)務(wù)利潤率”影響最大。
總結(jié)
此次案例分析主要利用SPSSAU針對主成分回歸進(jìn)行描述,首先對現(xiàn)有數(shù)據(jù)進(jìn)行處理,得到的分析項(xiàng)進(jìn)行主成分分析,其中包括判斷分析項(xiàng)與主成分之間的關(guān)系,KMO值與巴特球形檢驗(yàn),成分選擇個數(shù)以及提取成分,分析后將四個維度進(jìn)行命名作為線性回歸的自變量進(jìn)行回歸分析以及得到的結(jié)果分為兩大部分進(jìn)行描述,一為中間分析過程,二為回歸分析結(jié)果,因?yàn)榫€性回歸的因變量有三個,所有重復(fù)進(jìn)行三次分析,其他兩次分析在其它模塊中,對于結(jié)論進(jìn)行描述與總結(jié),分析完畢。