唐宇迪python-機(jī)器學(xué)習(xí)-進(jìn)階實戰(zhàn)
2023-03-04 14:02 作者:bili_1559000721 | 我要投稿
Step2: Data Preprocessing
數(shù)據(jù)預(yù)處理,就是將數(shù)據(jù)處理下,為模型輸入做準(zhǔn)備,其中包括:
處理missing value:這里學(xué)問有點深,如果各位有好的經(jīng)驗可以跟我交流下。以我淺薄的經(jīng)驗來說我一般會分情況處理
如果missing value占總體的比例非常小,那么直接填入平均值或者眾數(shù)
如果missing value所占比例不算小也不算大,那么可以考慮它跟其他特征的關(guān)系,如果關(guān)系明顯,那么直接根據(jù)其他特征填入;也可以建立簡單的模型,比如線性回歸,隨機(jī)森林
標(biāo)簽: