国产精品天干天干,亚洲毛片在线,日韩gay小鲜肉啪啪18禁,女同Gay自慰喷水

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

數(shù)據(jù)處理之數(shù)據(jù)歸一化

2023-05-27 00:25 作者:tevop2000  | 我要投稿

我們?yōu)槭裁匆鰯?shù)據(jù)歸一化,主要是數(shù)據(jù)在不同的量綱上,在機器學習領(lǐng)域中,不同的量綱和量綱單位,這樣的數(shù)據(jù)最終會影響到結(jié)果;為了解決這個問題我們要對數(shù)據(jù)做歸一化處理。

歸一化的目的就是使得預(yù)處理的數(shù)據(jù)被限定在一定的范圍內(nèi)(比如[0,1]或者[-1,1]),從而消除樣本數(shù)據(jù)的不良影響。


常用的歸一化算法如下:

1、min-max標準化(Min-Max Normalization)

也稱為離差標準化,是對原始數(shù)據(jù)的線性變換,使結(jié)果值映射到[0 - 1]之間。轉(zhuǎn)換函數(shù)如下:


其中max為樣本數(shù)據(jù)的最大值,min為樣本數(shù)據(jù)的最小值。這種方法有個缺陷就是當有新數(shù)據(jù)加入時,可能導致max和min的變化,需要重新定義。

2、Z-score標準化方法

這種方法給予原始數(shù)據(jù)的均值(mean)和標準差(standard deviation)進行數(shù)據(jù)的標準化。經(jīng)過處理的數(shù)據(jù)符合標準正態(tài)分布,即均值為0,標準差為1,轉(zhuǎn)化函數(shù)為:


其中為μ所有樣本數(shù)據(jù)的均值,σ為所有樣本數(shù)據(jù)的標準差。該種歸一化方式要求原始數(shù)據(jù)的分布可以近似為高斯分布,否則處理的效果會變差。

  • min-max標準化實現(xiàn)如下:

打印輸出dataframe

打印輸出df_norm

  • Z-score標準化實現(xiàn)如下:


數(shù)據(jù)處理之數(shù)據(jù)歸一化的評論 (共 條)

分享到微博請遵守國家法律
新邵县| 镇雄县| 吉木萨尔县| 留坝县| 佛山市| 九龙城区| 侯马市| 公主岭市| 广昌县| 双鸭山市| 利川市| 丹东市| 察哈| 南木林县| 营口市| 桓仁| 林周县| 富阳市| 黔西县| 宁河县| 平武县| 凉山| 吉安县| 泾川县| 藁城市| 蒙自县| 东光县| 雷波县| 拉孜县| 永宁县| 灵璧县| 宝丰县| 筠连县| 涟源市| 通道| 轮台县| 随州市| 石楼县| 仁布县| 澄迈县| 河曲县|