国产精品天干天干,亚洲毛片在线,日韩gay小鲜肉啪啪18禁,女同Gay自慰喷水

歡迎光臨散文網(wǎng) 會(huì)員登陸 & 注冊(cè)

拓端tecdat|R語(yǔ)言主成分分析PCA譜分解、奇異值分解預(yù)測(cè)分析運(yùn)動(dòng)員表現(xiàn)數(shù)據(jù)和降維可視

2022-02-03 13:30 作者:拓端tecdat  | 我要投稿

原文鏈接:http://tecdat.cn/?p=25067?

原文出處:拓端數(shù)據(jù)部落公眾號(hào)

本文描述了如何?使用R執(zhí)行主成分分析?(?PCA?)。您將學(xué)習(xí)如何?使用 PCA預(yù)測(cè)?新的個(gè)體和變量坐標(biāo)。我們還將提供?PCA 結(jié)果背后的理論。

在 R 中執(zhí)行 PCA 有兩種通用方法:

  • 譜分解?,檢查變量之間的協(xié)方差/相關(guān)性

  • ?檢查個(gè)體之間的協(xié)方差/相關(guān)性的奇異值分解

根據(jù) R 的幫助,SVD 的數(shù)值精度稍好一些。

可視化

創(chuàng)建基于 ggplot2 的優(yōu)雅可視化。

演示數(shù)據(jù)集

我們將使用運(yùn)動(dòng)員在十項(xiàng)全能中的表現(xiàn)數(shù)據(jù)集,這里使用的數(shù)據(jù)描述了運(yùn)動(dòng)員在兩項(xiàng)體育賽事中的表現(xiàn)?

數(shù)據(jù)描述:
一個(gè)數(shù)據(jù)框,包含以下13個(gè)變量的27個(gè)觀測(cè)值。

X100m
一個(gè)數(shù)字向量

跳遠(yuǎn)
一個(gè)數(shù)字向量

投籃
一個(gè)數(shù)字向量

高跳
一個(gè)數(shù)字向量

X400m
數(shù)字向量

X110m.hurdle
一個(gè)數(shù)字向量

飛碟
一個(gè)數(shù)字向量

撐桿跳高
一個(gè)數(shù)字向量

繩索
數(shù)字向量

X1500米
數(shù)字向量

級(jí)別
與等級(jí)相對(duì)應(yīng)的數(shù)字向量

點(diǎn)
一個(gè)數(shù)字向量,指定獲得的點(diǎn)數(shù)

運(yùn)動(dòng)會(huì)
水平變量 Decastar OlympicG

簡(jiǎn)而言之,它包含:

  • 訓(xùn)練個(gè)體(第 1 到 23 行)和訓(xùn)練變量(第 1 到 10 列),用于執(zhí)行主成分分析

  • 預(yù)測(cè)個(gè)體(第 24 至 27 行)和預(yù)測(cè)變量(第 11 至 13 列),其坐標(biāo)將使用 PCA 信息和通過(guò)訓(xùn)練個(gè)體/變量獲得的參數(shù)進(jìn)行預(yù)測(cè)。

加載數(shù)據(jù)并僅提取訓(xùn)練的個(gè)體和變量:


  1. head(dec)

計(jì)算 PCA

在本節(jié)中,我們將可視化 PCA。

  1. 進(jìn)行可視化

  1. 計(jì)算 PCA

prcomp

  1. 可視化?特征值?(碎石圖)。顯示每個(gè)主成分解釋的方差百分比。

  1. 具有相似特征的個(gè)人被歸為一組。

viz(res )

  1. 變量圖。正相關(guān)變量指向圖的同一側(cè)。負(fù)相關(guān)變量指向圖表的相反兩側(cè)。

vzpca(res )

  1. 個(gè)體和變量的雙標(biāo)圖

fvbiplot(res )

PCA 結(jié)果

  1. # 特征值

  2. eigva



  3. # 變量的結(jié)果

  4. coord # 坐標(biāo)

  5. contrib # 對(duì)PC的貢獻(xiàn)

  6. cos2 # 代表性的質(zhì)量

  7. # 個(gè)人的結(jié)果

  8. coord # 坐標(biāo)

  9. contrib # 對(duì)PC的貢獻(xiàn)

  10. cos2 # 代表性的質(zhì)量

使用 PCA 進(jìn)行預(yù)測(cè)

在本節(jié)中,我們將展示如何僅使用先前執(zhí)行的 PCA 提供的信息來(lái)預(yù)測(cè)補(bǔ)充個(gè)體和變量的坐標(biāo)。

預(yù)測(cè)個(gè)人

  1. 數(shù)據(jù):第 24 到 27 行和第 1 到 10 列。新數(shù)據(jù)必須包含與用于計(jì)算 PCA 的活動(dòng)數(shù)據(jù)具有相同名稱和順序的列(變量)。

  1. # ?預(yù)測(cè)個(gè)體的數(shù)據(jù)

  2. in <- dec[24:27, 1:10]

  1. 預(yù)測(cè)新個(gè)體數(shù)據(jù)的坐標(biāo)。使用 R 基函數(shù)?predict?():

predict

  1. 包括補(bǔ)充個(gè)人在內(nèi)的個(gè)人圖表:

  1. # 活躍個(gè)體的圖譜

  2. fvca_

  3. # 添加補(bǔ)充個(gè)體

  4. fdd(p)

個(gè)體的預(yù)測(cè)坐標(biāo)可以計(jì)算如下:

  1. 使用 PCA 的中心和比例對(duì)新的個(gè)人數(shù)據(jù)進(jìn)行中心化和標(biāo)準(zhǔn)化

  2. 通過(guò)將標(biāo)準(zhǔn)化值與主成分的特征向量(載荷)相乘來(lái)計(jì)算預(yù)測(cè)坐標(biāo)。

可以使用下面的 R 代碼:


  1. # 對(duì)補(bǔ)充個(gè)體進(jìn)行居中和標(biāo)準(zhǔn)化

  2. ined <- scale

  3. # 個(gè)體個(gè)體的坐標(biāo)


  4. rtaton

  5. ird <- t(apply)



補(bǔ)充變量

定性/分類變量

數(shù)據(jù)集?在第 13 列包含與比賽類型相對(duì)應(yīng)的?補(bǔ)充定性變量?。

定性/分類變量可用于按組為樣本著色。分組變量的長(zhǎng)度應(yīng)與活躍個(gè)體的數(shù)量相同。

  1. groups <- as.factor

  2. fvnd(res.pca

  3. )

計(jì)算分組變量水平的坐標(biāo)。給定組的坐標(biāo)計(jì)算為組中個(gè)體的平均坐標(biāo)。

  1. library(magrittr) # 管道函數(shù)%>%。

  2. # 1. 單個(gè)坐標(biāo)

  3. getind(res)

  4. # 2. 組的坐標(biāo)

  5. coord %>% >

  6. as_data_frame%>%

  7. selec%>%

  8. mutate%>%

  9. group_b %>%

定量變量

數(shù)據(jù):11:12 欄。應(yīng)與活躍個(gè)體的數(shù)量相同(此處為 23)

  1. quup <- dec[1:23, 11:12]

  2. head(quup .sup)

給定定量變量的坐標(biāo)被計(jì)算為定量變量與主成分之間的相關(guān)性。


  1. # 預(yù)測(cè)坐標(biāo)并計(jì)算cos2

  2. quaord <- cor

  3. quaos2 <- qord^2

  4. # 變量的圖形,包括補(bǔ)充變量

  5. p <- fviar(reca)

  6. fvdd(p, quord, color ="blue", geom="arrow")


PCA 結(jié)果背后的理論

變量的 PCA 結(jié)果

在這里,我們將展示如何計(jì)算變量的 PCA 結(jié)果:坐標(biāo)、cos2 和貢獻(xiàn):

  • var.coord?= 載荷 * 分量標(biāo)準(zhǔn)差

  • var.cos2?= var.coord ^ 2

  • var.contrib. 變量對(duì)給定主成分的貢獻(xiàn)為(百分比):(var.cos2 * 100)/(成分的總 cos2)


  1. # 計(jì)算坐標(biāo)

  2. #::::::::::::::::::::::::::::::::::::::::

  3. logs <- rotation

  4. sdev <- sdev

  5. vad <- t(apply)

  1. # 計(jì)算 Cos2

  2. #::::::::::::::::::::::::::::::::::::::::

  3. vaos2 <- vard^2

  4. head(vars2[, 1:4])

  1. # 計(jì)算貢獻(xiàn)

  2. #::::::::::::::::::::::::::::::::::::::::

  3. comos2 <- apply

  4. cnrib <- function

  5. var.otrb <- t(apply)

  6. head(vaib[, 1:4])

PCA 結(jié)果

  • ind.coord?= res.pca$x

  • 個(gè)人的 Cos2。兩步:

    • 計(jì)算每個(gè)個(gè)體與 PCA 重心之間的平方距離:d2 = [(var1_ind_i - mean_var1)/sd_var1]^2 + …+ [(var10_ind_i - mean_var10)/sd_var10]^2 + …+..

    • 將 cos2 計(jì)算為 ind.coord^2/d2

  • 個(gè)人對(duì)主成分的貢獻(xiàn):100 * (1 / number_of_individuals)*(ind.coord^2 / comp_sdev^2)。請(qǐng)注意,每列所有貢獻(xiàn)的總和為 100

  1. # 個(gè)人的坐標(biāo)

  2. #::::::::::::::::::::::::::::::::::

  3. inod <- rpa$x

  4. head(in.c[, 1:4])

  1. # 個(gè)人的Cos2

  2. #:::::::::::::::::::::::::::::::::

  3. # 1.個(gè)體與#PCA重心之間距離的平方

  4. # PCA重心的平方

  5. ceer<- center

  6. scle<- scale


  7. d <- apply(decaive,1,gnce, center, scale)

  8. # 2. 計(jì)算cos2。每一行的總和為1

  9. is2 <- apply(inrd, 2, cs2, d2)

  10. head(is2[, 1:4])

  1. # 個(gè)人的貢獻(xiàn)

  2. #:::::::::::::::::::::::::::::::


  3. inib <- t(apply(iord, 1, conib,

  4. sdev, nrow))

  5. head(inib[, 1:4])

最受歡迎的見(jiàn)解

1.matlab偏最小二乘回歸(PLSR)和主成分回歸(PCR)

2.R語(yǔ)言高維數(shù)據(jù)的主成分pca、 t-SNE算法降維與可視化分析

3.主成分分析(PCA)基本原理及分析實(shí)例

4.基于R語(yǔ)言實(shí)現(xiàn)LASSO回歸分析

5.使用LASSO回歸預(yù)測(cè)股票收益數(shù)據(jù)分析

6.r語(yǔ)言中對(duì)lasso回歸,ridge嶺回歸和elastic-net模型

7.r語(yǔ)言中的偏最小二乘回歸pls-da數(shù)據(jù)分析

8.r語(yǔ)言中的偏最小二乘pls回歸算法

9.R語(yǔ)言線性判別分析(LDA),二次判別分析(QDA)和正則判別分析(RDA)


拓端tecdat|R語(yǔ)言主成分分析PCA譜分解、奇異值分解預(yù)測(cè)分析運(yùn)動(dòng)員表現(xiàn)數(shù)據(jù)和降維可視的評(píng)論 (共 條)

分享到微博請(qǐng)遵守國(guó)家法律
和林格尔县| 丰台区| 阜阳市| 池州市| 永善县| 集安市| 松阳县| 招远市| 汕尾市| 军事| 清水河县| 泗洪县| 理塘县| 鹤庆县| 丽江市| 西乡县| 麟游县| 亚东县| 达孜县| 隆子县| 仁怀市| 怀来县| 达尔| 武山县| 大连市| 呼伦贝尔市| 丘北县| 会泽县| 鹤山市| 上饶市| 苏尼特右旗| 宁武县| 温泉县| 璧山县| 高青县| 原平市| 黑水县| 麟游县| 原平市| 泽州县| 河源市|