国产精品天干天干,亚洲毛片在线,日韩gay小鲜肉啪啪18禁,女同Gay自慰喷水

歡迎光臨散文網(wǎng) 會(huì)員登陸 & 注冊

簡單數(shù)據(jù)處理與可視化

2023-04-19 09:29 作者:不要學(xué)經(jīng)管  | 我要投稿

終于把輔修畢業(yè)論文的事兒解決的差不多了,已經(jīng)很久沒有記錄東西了,正好昨天幫別人做了個(gè)簡單的Python作業(yè),就拿出來寫寫。

首先,導(dǎo)入相關(guān)庫,并讀入文件,觀察數(shù)據(jù)形式:

可以發(fā)現(xiàn),前兩行我們不需要,所以drop掉,并且將index變回默認(rèn)狀態(tài):

已經(jīng)變成我們想要的dataframe形式了,首先就開始第一題,遇到分類問題,不需要想,大概率是用groupby,由于數(shù)據(jù)還是str類型,首先需要轉(zhuǎn)換為整型類型:

結(jié)果如下:

可以發(fā)現(xiàn)2022年的AI詞頻數(shù)為0,按道理這是異常值,但題目中沒特別注明,不知道他們老師有沒有要求剔除,就不剔除了,這也不是本題的重心。

第二問也很簡單,使用seaborn繪制多變量兩兩間散點(diǎn)圖明顯比matplotlib方便許多。

第三問,觀察一開始的dataframe,可以發(fā)現(xiàn)行業(yè)代碼后有數(shù)字,這并不是我們需要的,首先需要提取行業(yè)代碼中的第一個(gè)字母:

任務(wù)完成

簡單數(shù)據(jù)處理與可視化的評論 (共 條)

分享到微博請遵守國家法律
蒲江县| 曲水县| 梁河县| 保山市| 东丽区| 皋兰县| 远安县| 宝山区| 大英县| 鄂托克旗| 青铜峡市| 澎湖县| 孟津县| 台东市| 五寨县| 南昌市| 丰宁| 永清县| 荣昌县| 林州市| 彭阳县| 博罗县| 上高县| 铜梁县| 水城县| 陕西省| 中阳县| 屯留县| 涿鹿县| 鄂伦春自治旗| 华容县| 巢湖市| 简阳市| 固安县| 林西县| 新乡市| 吉安市| 凤山县| 鄂伦春自治旗| 北票市| 鹿邑县|