ApacheCN 機(jī)器學(xué)習(xí)實(shí)戰(zhàn)講義 三、決策樹(shù)
2018-05-01 14:08 作者:絕不原創(chuàng)的飛龍 | 我要投稿

決策樹(shù) 概述
決策樹(shù)(Decision Tree)算法主要用來(lái)處理分類(lèi)問(wèn)題,是最經(jīng)常使用的數(shù)據(jù)挖掘算法之一。
決策樹(shù) 場(chǎng)景
一個(gè)叫做 "二十個(gè)問(wèn)題" 的游戲,游戲的規(guī)則很簡(jiǎn)單:參與游戲的一方在腦海中想某個(gè)事物,其他參與者向他提問(wèn),只允許提 20 個(gè)問(wèn)題,問(wèn)題的答案也只能用對(duì)或錯(cuò)回答。問(wèn)問(wèn)題的人通過(guò)推斷分解,逐步縮小待猜測(cè)事物的范圍,最后得到游戲的答案。
一個(gè)郵件分類(lèi)系統(tǒng),大致工作流程如下:

首先檢測(cè)發(fā)送郵件域名地址。如果地址為 myEmployer.com, 則將其放在分類(lèi) "無(wú)聊時(shí)需要閱讀的郵件"中。
如果郵件不是來(lái)自這個(gè)域名,則檢測(cè)郵件內(nèi)容里是否包含單詞 "曲棍球" , 如果包含則將郵件歸類(lèi)到 "需要及時(shí)處理的朋友郵件",
如果不包含則將郵件歸類(lèi)到 "無(wú)需閱讀的垃圾郵件" 。
閱讀全文:http://ml.apachecn.org/mlia/design-tree/
標(biāo)簽: