国产精品天干天干,亚洲毛片在线,日韩gay小鲜肉啪啪18禁,女同Gay自慰喷水

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

數(shù)據(jù)規(guī)約之PCA降維

2023-05-28 17:02 作者:tevop2000  | 我要投稿

????? PCA也叫主成分分析,是一種統(tǒng)計(jì)方法。通過正交變換將一組可能存在相關(guān)性的變量轉(zhuǎn)換為一組線性不相關(guān)的變量,轉(zhuǎn)換后的這組變量叫主成分。簡單理解,PCA就是去除不重要的特征,將多個特征轉(zhuǎn)換成幾個主成分,這些主成分是原始變量的線性組合,且彼此之間互不相關(guān),其能反映出原始數(shù)據(jù)的大部分信息,而且可以提升數(shù)據(jù)處理的速度。

????PCA的核心思想是降維,這個過程中可能會損失精度,但是能換取更高的計(jì)算速度。

我們用sklearn的已有方法來舉例:

????sklearn中為我們已經(jīng)封裝好了對應(yīng)的PCA接口,下面我們使用PCA對sklearn中自帶的一個手寫數(shù)字?jǐn)?shù)據(jù)集進(jìn)行降維。

1、載入數(shù)據(jù)集

2、數(shù)據(jù)分割,劃分訓(xùn)練集和測試集,現(xiàn)在數(shù)據(jù)有64個特征值

3、在不進(jìn)行降維的情況下,運(yùn)行KNN模型,查看準(zhǔn)確率為0.98

4、進(jìn)行PCA降維,我們保留95%的特征,PCA降維后還有28個特征

5、運(yùn)行KNN模型,查看準(zhǔn)確率基本一致,還是0.98

PCA降維后,準(zhǔn)確度基本沒變化還是0.98,但是特征維度卻從之前的64維降到28維。

數(shù)據(jù)規(guī)約之PCA降維的評論 (共 條)

分享到微博請遵守國家法律
米林县| 家居| 兰州市| 马关县| 阿勒泰市| 淄博市| 玉田县| 土默特左旗| 石首市| 屯昌县| 长宁县| 小金县| 桂平市| 宜昌市| 龙岩市| 宝山区| 吴川市| 湖北省| 滁州市| 正镶白旗| 新竹县| 嵩明县| 方城县| 呼玛县| 赤峰市| 永仁县| 石城县| 鸡泽县| 兴义市| 舟山市| 精河县| 上蔡县| 无锡市| 清涧县| 洞头县| 墨脱县| 澄城县| 浮山县| 汉寿县| 保定市| 通许县|