国产精品天干天干,亚洲毛片在线,日韩gay小鲜肉啪啪18禁,女同Gay自慰喷水

歡迎光臨散文網 會員登陸 & 注冊

SPSS分層聚類操作指南

2021-11-12 11:27 作者:SPSSAU官方賬號  | 我要投稿

分層聚類,又稱層次聚類、系統(tǒng)聚類,顧名思義是指聚類過程是按照一定層次進行的。

數(shù)據(jù)分析過程中如果需要按變量(標題)聚類,那么此時就應該使用分層聚類,并且結合聚類樹狀圖進行綜合判定分析。比如當前有8個裁判對于300個選手進行打分,試圖想對8個裁判進行聚類,以挖掘出裁判的打分偏好風格類別情況,此時則需要進行分層聚類。


分層聚類的基本思想是:

在聚類分析的開始,每個樣本(或變量)單獨作為一組,然后按照某種方法度量所有樣本(或變量)之間的親疏程度,把距離相近的先樣本(或變量)先聚成類,距離相遠的后聚成類,如此反復,直到所有樣本(或變量)聚成一類為止。

分層聚類有幾點需要特別注意:

1:僅針對定量數(shù)據(jù)進行分層聚類;

2:如果數(shù)據(jù)的單位有較大差別,可首先對于數(shù)據(jù)進行標準化處理后,針對標準化數(shù)據(jù)進行分層聚類;

SPSSAU用戶可點擊 數(shù)據(jù)處理-生成變量-選擇標準化(S),進行數(shù)據(jù)標準化處理。

3:由于均為定量數(shù)據(jù),因而從原理角度上,分層聚類時應該使用Pearson相關系數(shù)去度量距離,相關系數(shù)值越大說明越緊密,則說明距離越近,相關系數(shù)值越小說明越疏遠,說明距離越遠;SPSSAU默認使用Pearson相關系數(shù)表示距離大??;

案例分析

1、背景

當前有8個裁判對300名選手打分,最低分為1分,最高分為10分;希望對8個裁判進行聚類,以識別出裁判的風格類型??偣?個裁判共有8列數(shù)據(jù),并且共有300行。由于打分全部均是從1到10分,8列數(shù)據(jù)的單位均一樣,因此在分析之前不需要進行標準化數(shù)據(jù)(當然進行標準化處理也沒有問題)。

2、操作步驟

本案例中總共涉及8個標題,SPSSAU操作截圖如下:

SPSSAU會默認聚類為3類并且呈現(xiàn)表格結果,如果希望更多的類別個數(shù),可自行進行設置。

3、SPSSAU輸出結果

SPSSAU會首先輸出聚類項的基本描述情況,接著輸出每項的聚類類別歸屬情況;并且輸出樹狀圖,如下所述:

聚類項描述分析

上表格展示總共8個分析項(即8個裁判數(shù)據(jù))的基本情況,包括均值,最大或者最小值,中位數(shù)等,以便對于基礎數(shù)據(jù)有個概括性了解。整體上看,8個裁判的打分基本平均在8分以上。

SPSSAU:智能化分析
聚類類別分布表

總共聚類為3個類別,以及具體分析項的對應關系情況。在上表格中展示出來,上表格可以看出:裁判8單獨作為一類;裁判5,3,7這三個聚為一類;以及裁判1,6,2,4作為一類。

聚類類別與分析項上的對應關系可以在上表格中得到,同時也可以查看聚類樹狀圖得出更多信息。至于聚類類別分別應該叫做什么名字,這個需要結合對應有關系情況,自己單獨進行命名。

上圖為聚類樹狀圖的展示,聚類樹狀圖是將聚類的具體過程用圖示法手法進行展示;最上面一行的數(shù)字僅僅是一個刻度單位,代表相對距離大??;一個結點表示一次聚焦過程。

樹狀圖的解讀上,建議單獨畫一條垂直線,然后對應查看分成幾個類別,以及每個類別與分析項的對應關系。比如下圖中,紅色垂直線最終會拆分成3個類別:第1個類別對應裁判8;第2個類別對應裁判5,3,7;第3個類別對應裁判1,6,2,4。

當然在分析時也可以考慮分成2個類別,此時只需要對應將垂直線移動即可:

上圖展示出僅分為2個類別時的情況;如果聚類成2個類別;此時裁判8單獨作為一個類別;裁判5,4,7,1,6,2,4會單獨聚為一類。

如果是聚為四類;從上圖可看出,明顯的已經不再合適。原因在于垂直線不好區(qū)分成四類。也即說明有2個類別本應該在一起更合適(上圖中的裁判1與6/2/4);但是如果分成4類,此時裁判1會單獨成一類。所以畫垂直線無法區(qū)分出類別。

因而綜合分析來看,最終聚類為3個類別最為適合。

文字分析

本次研究共涉及8個裁判對于300個選手的打分數(shù)據(jù),打分從1到10分;并沒有量綱問題,因而對平數(shù)據(jù)不需要進行標準化處理(如果有量綱單位問題,最好先進行標準化處理)具體分層聚類時使用Pearson相關系數(shù)度量距離大小,同時使用組平均距離法進行分析。

結合樹狀圖進行分析,如果聚類為一個類別,此時其中一個類別僅對應1項,另外一個類別對應7項;如果聚類為四個類別,其中有一項無法很好的區(qū)分成一類;最終聚類為三類最為合適,第1個類別對應裁判8;第2個類別對應裁判5,3,7;第3個類別對應裁判1,6,2,4。


SPSS分層聚類操作指南的評論 (共 條)

分享到微博請遵守國家法律
昌平区| 乌海市| 竹山县| 岳西县| 龙岩市| 张家港市| 通化市| 湾仔区| 青川县| 东光县| 西宁市| 浠水县| 曲沃县| 萨迦县| 连州市| 临澧县| 和林格尔县| 葫芦岛市| 长海县| 盐津县| 镇赉县| 望谟县| 呼玛县| 华坪县| 和龙市| 武威市| 镇江市| 蓬溪县| 山西省| 石渠县| 新河县| 松溪县| 奉贤区| 天门市| 三原县| 肃北| 桐乡市| 和平区| 抚松县| 贵溪市| 马尔康县|