什么是人工智能?人工智能、機器學(xué)習(xí)、深度學(xué)習(xí)三者之間有什么關(guān)系嗎?
· 什么是人工智能?
人工智能的終極目標是制造出具有人類智能的機器。人工智能的定義包含兩部分,即“人工”和“智能”。
維基百科給出的定義是:人工智能是由機器表現(xiàn)的智能,相對于人類和其他動物所表現(xiàn)的自然智能。這是關(guān)于“人工”的定義,即和人類或自然智能相對。但對于什么是“智能”,大家現(xiàn)在唯一認同的智能就是人本身的智能,而我們對人類自身的智能理解非常有限。通俗的講,一個機器只要能模擬人的認知功能,如人類思維中的學(xué)習(xí)和問題求解等,就認為它具有人工智能。
進入21世紀,隨著互聯(lián)網(wǎng)的發(fā)展和計算機系統(tǒng)的普及,產(chǎn)生了與日俱增的數(shù)據(jù),為人工智能提供了大量的訓(xùn)練數(shù)據(jù)。另外,計算機硬件技術(shù)的飛速發(fā)展,更快的CPU、通用GPU的出現(xiàn)、更快的網(wǎng)絡(luò)連接和更好的分布式計算的軟件基礎(chǔ)設(shè)施,為運行復(fù)雜的人工智能算法提供了足夠的計算力。
· 什么是機器學(xué)習(xí)?
機器學(xué)習(xí)作為人工智能的一個子領(lǐng)域,主要研究如何模擬或者實現(xiàn)人類智能中的學(xué)習(xí)功能,也就是讓機器自動的從經(jīng)驗中獲取新的知識或技能。
現(xiàn)在機器學(xué)習(xí)已經(jīng)得到廣泛的應(yīng)用,如:數(shù)據(jù)挖掘、計算機視覺、自然語言處理、生物特征識別、搜索引擎、醫(yī)學(xué)診斷、檢測信用卡欺詐、證券市場分析、DNA序列測序、語音和手寫識別、機器人和無人駕駛汽車等等。
“機器學(xué)習(xí)”這個詞最初是由阿瑟·塞繆爾在1959年創(chuàng)造的。他給出了一個通用的定義:機器學(xué)習(xí)是一個研究領(lǐng)域,它使計算機能夠?qū)W習(xí)而不是被顯示編程。例如:一個垃圾郵件過濾器程序,如果知識依靠寫入程序的規(guī)則去判斷給定的郵件是不是垃圾郵件,比如標題中包含“開”“發(fā)”“票”三個字的一般是垃圾郵件,則不是機器學(xué)習(xí)。
另一個通用的定義,更形式化或者工程化,是由湯姆·米切爾在1997年給出的,即:如果一個計算機程序在任務(wù)T上的性能(用P來衡量),可以通過經(jīng)驗E得到該井,稱該程序能從經(jīng)驗E中學(xué)習(xí)。例如:對于一個垃圾郵件過濾器程序來說,它的任務(wù)T就是判斷給定的郵件是否為垃圾郵件,可以用判斷正確的百分比(準確率)來衡量其完成任務(wù)的好壞,而用來學(xué)習(xí)的經(jīng)驗就是被用戶標記過的一些垃圾郵件和正常郵件,這些郵件稱為訓(xùn)練樣例,他們構(gòu)成的用以學(xué)習(xí)的訓(xùn)練集就是經(jīng)驗。所以,如果一個垃圾郵件過濾器能從獲得經(jīng)驗(訓(xùn)練數(shù)據(jù))中,改進其判斷一個新郵件是否為垃圾郵件的準確率的話,就稱之為有學(xué)習(xí)能力。
機器學(xué)習(xí)系統(tǒng)有很多種,可以按照不同的維度將他們劃分成多個類型。例如:按照學(xué)習(xí)過程中受到的人類指導(dǎo)的量和類型,可以分為監(jiān)督學(xué)習(xí)、半監(jiān)督學(xué)習(xí)、無監(jiān)督學(xué)習(xí)和強化學(xué)習(xí),這也是最主要的一種劃分機器學(xué)習(xí)類型的方案。
· 什么是深度學(xué)習(xí)?
深度學(xué)習(xí)模型本質(zhì)上是多層神經(jīng)網(wǎng)絡(luò)組合的模型。神經(jīng)網(wǎng)絡(luò)是一種連接主義模型,它認為人類的認知過程是由大量簡單神經(jīng)元組成的神經(jīng)網(wǎng)絡(luò)中的信息處理過程?,F(xiàn)如今,隨著訓(xùn)練數(shù)據(jù)的增多以及計算能力的增強,神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)能力得以增強,在語音、圖像以及自然語言等許多領(lǐng)域都取得了顯著的效果。
深度學(xué)習(xí)的發(fā)展大致可以總結(jié)為四個階段:起源、第一次浪潮、第二次浪潮、第三次浪潮。
起源:1943年,由神經(jīng)科學(xué)家W.S.麥卡洛克和數(shù)學(xué)家W.皮茨參照生物神經(jīng)元的結(jié)構(gòu)和工作原理,提出的抽象神經(jīng)元M-P模型,是人工神經(jīng)網(wǎng)絡(luò)的起源。
第一次浪潮:1958年,計算機科學(xué)家羅森布拉特提出兩層神經(jīng)元組成的神經(jīng)網(wǎng)絡(luò),稱為感知機模型。該模型可以進行二分類,并于1962年被證明具有收斂性,理論與實踐的成功引發(fā)神經(jīng)網(wǎng)絡(luò)的發(fā)展的第一次浪潮。然而,1969年,感知機模型被證明本質(zhì)上是一種線性模型,無法對線性不可分的數(shù)據(jù)進行分類,直接導(dǎo)致神經(jīng)網(wǎng)絡(luò)的研究停滯將近20年。
第二次浪潮:1986年,神經(jīng)網(wǎng)絡(luò)之父杰弗里·欣頓發(fā)明了適用于多層感知機模型(MLP)的反向傳播算法(BP),并采用sigmoid函數(shù)對輸入數(shù)據(jù)進行非線性映射,有效解決了非線性的分類問題。該發(fā)明引發(fā)了神經(jīng)網(wǎng)絡(luò)發(fā)展的第二次浪潮。然而,1991年,BP算法被指出存在梯度消失的問題,直接阻礙了深度神經(jīng)網(wǎng)絡(luò)的進一步發(fā)展。
第三次浪潮:2006年,杰弗里·欣頓和他的學(xué)生提出了深度神經(jīng)網(wǎng)絡(luò)訓(xùn)練中梯度消失問題的求解辦法,即才用無監(jiān)督學(xué)習(xí)的方法對神經(jīng)網(wǎng)絡(luò)的參數(shù)初始化,再采用監(jiān)督學(xué)習(xí)的方法對參數(shù)微調(diào)。該發(fā)明直接掀起了神經(jīng)網(wǎng)絡(luò)發(fā)展的第三次浪潮。
· 人工智能、機器學(xué)習(xí)、深度學(xué)習(xí)三者有什么關(guān)系?
人工智能、機器學(xué)習(xí)、深度學(xué)習(xí)三者的關(guān)系,是相繼包含的關(guān)系。機器學(xué)習(xí)是人工智能的一個子領(lǐng)域,而深度學(xué)習(xí)是一種機器學(xué)習(xí)方法,機器學(xué)習(xí)還有很多其他模型和方法,例如:邏輯回歸、支持向量機、決策樹等等。