国产精品天干天干,亚洲毛片在线,日韩gay小鲜肉啪啪18禁,女同Gay自慰喷水

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

數(shù)據(jù)降維,不得不說的經(jīng)典機(jī)器學(xué)習(xí)方法——PCA

2023-08-01 16:34 作者:爾云間  | 我要投稿

信息過度復(fù)雜是多變量數(shù)據(jù)最大的挑戰(zhàn)之一。許多小伙伴經(jīng)常會遇到這種問題,于是我們會考慮用降維來解決,這時(shí)候很多人都會想到PCA降維,那么PCA到底是什么呢?今天小云來帶大家探索PCA算法的原理。

PCA(Principal Component Analysis)全稱為主成分分析,是一種無監(jiān)督的數(shù)據(jù)降維方法,通過主成分分析可以盡可能保留下具備區(qū)分性的低維數(shù)據(jù)特征。主成分分析圖能幫助我們直觀地感受樣本在降維后空間中的分簇和聚合情況,這在一定程度上亦能體現(xiàn)樣本在原始空間中的分布情況。

相信大家看到這里應(yīng)該大致能知道PCA究竟能干嘛了,那么該怎么實(shí)現(xiàn)呢?別著急,小果下面通過一個(gè)分析過程來帶大家學(xué)習(xí)具體流程。

1、載入數(shù)據(jù)及相關(guān)R包

2.PCA分析

3.主成分選取

說明:結(jié)果中的PC1、PC2、PC3、和PC4是計(jì)算出來的主成分,圖中的Standard deviation代表每個(gè)主成分的標(biāo)準(zhǔn)差,Proportion of Variance代表每個(gè)主成分的貢獻(xiàn)率,Cumulative Proportion代表各個(gè)主成分的累積貢獻(xiàn)率。每個(gè)主成分都不屬于X1、X2、X3和X4中的任何一個(gè)。第一主成分、第二主成分、第三主成分和第四主成分都是X1、X2、X3和X4的線性組合,也就是說最原始數(shù)據(jù)的成分經(jīng)過線性變換得到了各個(gè)主成分。一般地,選擇累積貢獻(xiàn)率達(dá)到八成的前幾個(gè)主成分即可(這個(gè)實(shí)例中我們選擇前兩個(gè),畢竟第二主成分的貢獻(xiàn)率也比較大)。

4.PCA可視化

結(jié)果展示

分析最后我們會得到一個(gè)PCA分析圖,如下圖1所示,圖中的橫縱坐標(biāo)分別對應(yīng)主成分PC1和PC2,整體表現(xiàn)了所有樣本在這兩個(gè)主成分上的分布。同時(shí)小伙伴們還可以保存樣本在主成分上的表達(dá)水平來開展其他分析,具體樣例如圖2所示,每行為一個(gè)樣本,列為不同的主成分。

大功告成!分析到這里就結(jié)束了,相信大家已經(jīng)掌握了,感興趣的小伙伴快去試試吧!

這里推薦一下小云新開發(fā)的零代碼云生信分析工具平臺包含超多零代碼小工具,上傳數(shù)據(jù)一鍵出圖,感興趣的小伙伴歡迎了解~

網(wǎng)址:http://www.biocloudservice.com/home.html

今天小果的分享就到這里,歡迎大家和小云一起討論學(xué)習(xí),下期再見哦!





數(shù)據(jù)降維,不得不說的經(jīng)典機(jī)器學(xué)習(xí)方法——PCA的評論 (共 條)

分享到微博請遵守國家法律
洛阳市| 定襄县| 荆门市| 鄄城县| 阿合奇县| 申扎县| 志丹县| 象州县| 罗田县| 聂拉木县| 健康| 郧西县| 鄂伦春自治旗| 礼泉县| 盐源县| 集贤县| 甘洛县| 嘉定区| 景洪市| 五河县| 隆化县| 仁寿县| 昆明市| 梓潼县| 长治县| 娄烦县| 平邑县| 浮梁县| 晋宁县| 洛浦县| 临城县| 河东区| 彝良县| 卓资县| 永川市| 特克斯县| 乌鲁木齐县| 枣庄市| 咸丰县| 德格县| 喀什市|