国产精品天干天干,亚洲毛片在线,日韩gay小鲜肉啪啪18禁,女同Gay自慰喷水

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

權(quán)威整理|模式識別基礎(chǔ)重要研究進(jìn)展(二)

2020-10-21 16:24 作者:深藍(lán)學(xué)院  | 我要投稿
本文來自模式識別國家重點實驗室組織發(fā)布的模式識別學(xué)科發(fā)展報告,已得到模式識別國家重點實驗室授權(quán)發(fā)布。

前天已發(fā)布了以下13項理論方法的前六項,本篇發(fā)布7-13項內(nèi)容。

前六項內(nèi)容傳送門:https://www.bilibili.com/read/cv8017817

全文大綱

本文選出以下13項理論方法或任務(wù)作為過去歷史上模式識別領(lǐng)域基礎(chǔ)理論方法的重要成就

1.?貝葉斯決策與估計:統(tǒng)計決策的基礎(chǔ)理論。

2.?概率密度估計:一類重要的無監(jiān)督學(xué)習(xí)方法,統(tǒng)計模式識別的重要基礎(chǔ),模式分析的重要工具。

3.?分類器設(shè)計:模式識別系統(tǒng)實現(xiàn)中最重要的任務(wù),有多種模型設(shè)計和學(xué)習(xí)方法,這里主要介紹監(jiān)督學(xué)習(xí)。

4.?聚類:一類重要的無監(jiān)督學(xué)習(xí)方法,模式分析的重要工具。

5.?特征提取與學(xué)習(xí):模式的特征表示對模式分類的性能有決定性影響,如何從數(shù)據(jù)提取特征、選擇特征或?qū)W習(xí)特征表示是一個重要的研究方向。

6.?人工神經(jīng)網(wǎng)絡(luò)與深度學(xué)習(xí):人工神經(jīng)網(wǎng)絡(luò)是一類重要的模式分析和識別方法,發(fā)展到深度神經(jīng)網(wǎng)絡(luò)形成了目前最成功的深度學(xué)習(xí)系列方法和研究方向。

7.?核方法與支持向量機(jī):以支持向量機(jī)為主的核方法在20世紀(jì)90年代成為模式識別的一個主流方向,至今仍在模式識別研究和應(yīng)用中發(fā)揮重要作用。

8.?句法結(jié)構(gòu)模式識別:基于句法或結(jié)構(gòu)分析的模式識別方法一直以來是與統(tǒng)計模式識別并列的一個重要分支。

9.?概率圖模型:概率圖模型是一類重要的模式結(jié)構(gòu)分析或結(jié)構(gòu)化預(yù)測方法,因為其區(qū)別于其他結(jié)構(gòu)模式識別方法的獨特性,對其單獨介紹。

10.?集成學(xué)習(xí):集成學(xué)習(xí)通過融合多個學(xué)習(xí)器來提升性能, 在20世紀(jì)80年代以來已有大量研究和應(yīng)用,形成了系統(tǒng)的理論和系列方法。

11.?半監(jiān)督學(xué)習(xí):半監(jiān)督學(xué)習(xí)是20世紀(jì)90年代以來發(fā)展起來的一類可同時利用標(biāo)記樣本和無標(biāo)記樣本的分類器學(xué)習(xí)方法,至今仍有大量研究。

12.?遷移學(xué)習(xí):遷移學(xué)習(xí)利用不同領(lǐng)域或不同分布特性的樣本數(shù)據(jù)來優(yōu)化分類器模型,受到了廣泛重視,發(fā)展了一系列模型和方法。

13.?多任務(wù)學(xué)習(xí):多任務(wù)學(xué)習(xí)利用多個分類或建模任務(wù)(包括聚類、回歸、數(shù)據(jù)重構(gòu)等)的相關(guān)性,同時學(xué)習(xí)多個任務(wù),可提升每個任務(wù)的泛化性能,得到了廣泛重視和應(yīng)用。

以下為正文部分,全文共計一萬余字,建議保存收藏閱讀~

喜歡我們分享的文章別忘記收藏點贊,給我們更新的動力~^-^



7. 核方法與支持向量機(jī)

核方法是解決線性不可分模式分析問題的一種有效途徑,其核心思想是:首先,通過某種非線性映射將原始數(shù)據(jù)嵌入到合適的高維特征空間;然后,利用通用的線性學(xué)習(xí)器在這個新的空間中分析和處理模式。相對于使用通用非線性學(xué)習(xí)器直接在原始數(shù)據(jù)上進(jìn)行分析的范式,核方法有明顯的優(yōu)勢:首先,通用非線性學(xué)習(xí)器不便反應(yīng)具體應(yīng)用問題的特性,而核方法的非線性映射由于面向具體應(yīng)用問題設(shè)計而便于集成問題相關(guān)的先驗知識。再者,線性學(xué)習(xí)器相對于非線性學(xué)習(xí)器有更好的過擬合控制從而可以更好地保證泛化性能。還有,很重要的一點是核方法還是實現(xiàn)高效計算的途徑,它能利用核函數(shù)將非線性映射隱含在線性學(xué)習(xí)器中進(jìn)行同步計算,使得計算復(fù)雜度與高維特征空間的維數(shù)無關(guān)。在可再生核希爾伯特空間中,核技巧解決了顯式特征映射方法中存在的計算代價大和計算復(fù)雜度高的缺點,有效地避免了維數(shù)災(zāi)難的問題。Mercer定理的建立為核技巧的實施提供了理論支撐。著名的核方法包括核感知機(jī)、核支持向量機(jī)、核主成分分析、核判別分析、高斯過程等。隨后,核嶺回歸、核典型相關(guān)分析、核偏最小二乘分析、譜聚類核化、核矩陣學(xué)習(xí)、核貝葉斯推斷等相繼得到發(fā)展。核學(xué)習(xí)方法成為推動模式分類、聚類、特征提取等非線性化發(fā)展的主要技術(shù)途徑。另外,借助于核主成分分析方法,人們建立了關(guān)于線性模式分類方法核化的一般性理論,發(fā)展了多核學(xué)習(xí)的算法體系。核方法在生物特征識別、數(shù)據(jù)挖掘、生物信息學(xué)等領(lǐng)域得到廣泛應(yīng)用。

核方法的最典型應(yīng)用是支持向量機(jī)模型。支持向量機(jī)以統(tǒng)計學(xué)習(xí)理論的VC維理論和結(jié)構(gòu)風(fēng)險最小原理為基礎(chǔ),目標(biāo)是基于有限的樣本信息學(xué)習(xí)分類模型,該模型能在復(fù)雜性和泛化能力尋求最佳折中。具體說,支持向量機(jī)可以看作是一個二類分類模型,其求解目標(biāo)是在確定一個分類超平面使得間隔(所有樣本與分類超平面之間距離的最小值)最大。通過將支持向量機(jī)的原問題轉(zhuǎn)化為對偶問題,支持向量機(jī)的學(xué)習(xí)核心從間隔最大化的學(xué)習(xí)問題轉(zhuǎn)化為支持向量的學(xué)習(xí)問題。其中,支持向量指的是最終用于確定分類器參數(shù)的向量。另一方面,基于對偶問題,可以明確地看出不同支持向量機(jī)的核心體現(xiàn)在核矩陣(或者對應(yīng)核函數(shù))的構(gòu)造?;诰臉?gòu)造(或通過多核學(xué)習(xí)得到)的核函數(shù),可以有效地處理數(shù)據(jù)的非線性難題。同時,通過核函數(shù),可以在高維特征空間中,甚至無限維特征空間中實現(xiàn)分類問題。此外,支持向量機(jī)使用鉸鏈(合頁)損失函數(shù)(hinge loss)計算經(jīng)驗風(fēng)險并在求解系統(tǒng)中加入了正則化項以優(yōu)化結(jié)構(gòu)風(fēng)險,是一個具有稀疏性和穩(wěn)健性的分類器。支持向量機(jī)可以通過核方法進(jìn)行非線性分類,是常見的核學(xué)習(xí)方法之一。支持向量機(jī)的理論基礎(chǔ)被提出于1964年,在二十世紀(jì)90年代后得到快速發(fā)展并衍生出一系列改進(jìn)和擴(kuò)展算法,在圖像識別、文本分類等模式識別問題中得到廣泛應(yīng)用。

核方法還被廣泛應(yīng)用在其它模式識別和機(jī)器學(xué)習(xí)問題中。如將傳統(tǒng)的線性特征提取算法通過核函數(shù)來實現(xiàn)非線性化的擴(kuò)展,具體包括:核主成份分析(KPCA)、核線性判別分析(KLDA)、核最小二乘、核典型相關(guān)分析、核獨立成份分析(KICA)等。在核學(xué)習(xí)的理論方面也取得了重要進(jìn)展,比如人們發(fā)現(xiàn)線性方法的核化與KPCA之間的內(nèi)在聯(lián)系。同時,建立了多核學(xué)習(xí)與核選擇方法。核函數(shù)與聚類相結(jié)合,如核K均值算法(Kernel K-means),顯著提升了傳統(tǒng)聚類算法的非線性表達(dá)能力。另外,在概率密度估計中核函數(shù)也得到了廣泛的應(yīng)用,是典型的非參數(shù)估計方法之一,比如基于RBF核以及Parzen窗的概率密度估計方法等。最后,在結(jié)構(gòu)模式識別中,核函數(shù)也得到了廣泛的應(yīng)用。結(jié)構(gòu)模式識別處理的對象不是固定維度的向量而是結(jié)構(gòu)化的數(shù)據(jù)(如圖或串等),因此諸如序列串匹配核(String Kernel),圖匹配核(Graph Kernel)等被廣泛用來提升結(jié)構(gòu)模式識別問題的學(xué)習(xí)能力。高斯過程也可以看做是在貝葉斯學(xué)習(xí)中融合了核函數(shù)的優(yōu)點。

8. 句法結(jié)構(gòu)模式識別

句法模式識別(Syntactic Pattern Recognition)是由美籍華裔科學(xué)家傅京孫(King Sun Fu)教授于1970年代中期在形式語言理論的基礎(chǔ)上所建立的。句法模式識別經(jīng)常與結(jié)構(gòu)模式識別(Structural Pattern Recognition)在用詞上互換,合稱句法結(jié)構(gòu)模式識別,或者單稱句法模式識別或結(jié)構(gòu)模式識別。

結(jié)構(gòu)模式識別(Structural Pattern Recognition)是處理結(jié)構(gòu)數(shù)據(jù)的一類模式識別方法?,F(xiàn)實問題中,模式對象經(jīng)常包含豐富且重要的結(jié)構(gòu)信息,例如:一個文字中的筆劃及其相互關(guān)系,一個物體的部件及其相互關(guān)系。結(jié)構(gòu)模式識別方法將模式表示為一組基元的組合并對基元之間的相互關(guān)系進(jìn)行描述,在此表示的基礎(chǔ)上,通過對模式進(jìn)行結(jié)構(gòu)解析進(jìn)行識別。相對而言,統(tǒng)計模式識別方法一般用特征矢量來描述模式,基于概率決策理論劃分特征空間進(jìn)行模式分類,因而往往忽略模式的內(nèi)在結(jié)構(gòu)。結(jié)構(gòu)模式識別對結(jié)構(gòu)的分析與理解類似人腦的模式識別方式,具有更好的泛化性能(不需要大量樣本訓(xùn)練)。

常見的結(jié)構(gòu)模式識別任務(wù)包括:結(jié)構(gòu)數(shù)據(jù)的分類、匹配、結(jié)構(gòu)化預(yù)測等。而根據(jù)方法的特點,結(jié)構(gòu)模式識別方法可以大致分為三類:句法模式識別;結(jié)構(gòu)匹配;融合結(jié)構(gòu)與統(tǒng)計的方法。

句法模式識別的基本原則是,如果一類模式的樣本能用一個文法(一組句法規(guī)則)來描述,則可以通過句法解析(Parsing)來識別這類模式:如果解析的結(jié)果表明,模式基元組合能為給定的句法規(guī)則所產(chǎn)生,則可判別該模式屬于該類,否則就不屬于該類。另一方面,從模式樣本推導(dǎo)出一類文法的過程稱為文法推斷(Grammatical Inference)。學(xué)術(shù)界對模式的文法表示、句法解析、文法推斷方面提出了一系列方法和算法。在文法表示方面,短語結(jié)構(gòu)文法,如上下文敏感文法、上下文無關(guān)文法、正則文法等,常用來對串模式進(jìn)行表示。高維文法,如樹文法、圖文法等,可以對高維模式(如二維和三維圖形)進(jìn)行描述。其中,60年代提出的用于圖形分析的圖像描述語言(Picture Description Language)產(chǎn)生了長遠(yuǎn)影響。句法解析一般針對不同類型的文法提出不同的方法,如針對上下文無關(guān)文法的Cocke-Yonger-Kasami (CYK)解析方法。文法推斷方法也依賴于具體的文法類型,且算法大多很復(fù)雜。實際中,很多文法是專家針對具體問題人工設(shè)計得到的。

結(jié)構(gòu)匹配是結(jié)構(gòu)模式識別中的基本問題,其基本任務(wù)是計算兩個待比較的模式之間的相似度(或距離),同時給出基元之間的對應(yīng)關(guān)系。根據(jù)模式結(jié)構(gòu)的不同,結(jié)構(gòu)匹配可以分為串匹配和圖匹配。串匹配要求在某個字符串中找出與待查找字符串相同的所有子串。經(jīng)典算法包括:Knuth-Morris-Pratt算法,Boyer–Moore算法等。但現(xiàn)實問題中往往包含噪聲和形變,因此允許誤差的近似匹配方法更為常用。近似串匹配一般以編輯距離度量誤差,通過動態(tài)規(guī)劃算法尋找最優(yōu)匹配路徑。近似串匹配廣泛應(yīng)用于字符識別,語音識別,形狀匹配等問題中。圖匹配也分為精確圖匹配和近似圖匹配。精確圖匹配也稱圖同構(gòu)或子圖同構(gòu)問題,可用帶回溯的樹搜索算法實現(xiàn),但復(fù)雜度高,目前尚沒有多項式級算法。非精確匹配因為引入了誤差或距離度量,可以采用啟發(fā)式搜索,其好處是靈活、直觀,但復(fù)雜度高,不能保證是低于NP的。譜方法和基于松弛(relaxation)的匹配方法復(fù)雜度較低(一般介于O(n3)和O(n4)之間,n為圖的節(jié)點數(shù)),但不能保證全局最優(yōu)。70年代以來,圖匹配問題一直是模式識別領(lǐng)域的研究熱點之一,提出了大量的方法和算法,包括各種提高優(yōu)化效率的算法和自動估計距離度量參數(shù)的方法等。對于大規(guī)模圖的快速準(zhǔn)確匹配仍然是有待解決的問題。但是,已有的圖匹配方法已在模式識別(如圖形識別、文字識別)、計算機(jī)視覺(如三維視覺)、網(wǎng)絡(luò)信息檢索等領(lǐng)域得到了廣泛應(yīng)用。

經(jīng)典的句法模式識別方法和結(jié)構(gòu)匹配方法中通常不包含可學(xué)習(xí)參數(shù),對基元的特征屬性也缺乏有效的描述手段。實際中,這些方法通常會與統(tǒng)計方法相結(jié)合,以增強(qiáng)方法的靈活性和魯棒性。例如,文法與概率結(jié)合,構(gòu)成隨機(jī)文法,已經(jīng)被成功應(yīng)用于場景圖像理解等領(lǐng)域。核函數(shù)(Edit Distance Based Kernel, Graph Kernel)、遞歸神經(jīng)網(wǎng)絡(luò)、圖神經(jīng)網(wǎng)絡(luò)可以把結(jié)構(gòu)模式映射到向量空間,從而在向量空間采用統(tǒng)計模式識別的方法進(jìn)行匹配。

結(jié)構(gòu)化預(yù)測(Structured Output Prediction)是另一類重要的結(jié)構(gòu)模式識別問題,其任務(wù)是對相關(guān)的多個模式或基元同時進(jìn)行分類。典型的例子是對手寫字符串中所有字符同時分類、圖像中多個目標(biāo)和背景區(qū)域同時分類。該類方法通常為融合結(jié)構(gòu)和統(tǒng)計的混合方法,常用的方法包括概率圖模型(如:隱馬爾科夫模型、馬爾科夫隨機(jī)場、條件隨機(jī)場)、結(jié)構(gòu)化支持向量機(jī),神經(jīng)網(wǎng)絡(luò)(如:遞歸神經(jīng)網(wǎng)絡(luò),圖神經(jīng)網(wǎng)絡(luò))等。這些方法在語音識別、指紋識別、圖像復(fù)原,心電圖(ECG)分析、自動駕駛、地震波圖分析等領(lǐng)域取得了成功應(yīng)用。

結(jié)構(gòu)模式識別自上世紀(jì)70年代以來,其理論方法得到了巨大發(fā)展,相關(guān)模型、方法在圖形識別、文字識別、語音識別、視覺場景分析、行為識別、信息檢索等領(lǐng)域得到廣泛應(yīng)用。其理論方法與統(tǒng)計模式識別、人工神經(jīng)網(wǎng)絡(luò)、核方法性能互補(bǔ)、交叉融合并且相互啟發(fā),對人工智能領(lǐng)域的知識表示、推理、學(xué)習(xí)等有很大的參考價值;將統(tǒng)計模式識別與結(jié)構(gòu)模式識別相結(jié)合的統(tǒng)一方法也是未來重要的發(fā)展方向之一。

9. 概率圖模型

概率圖模型是將概率論與圖論相結(jié)合,以圖的形式研究多元隨機(jī)變量概率分布、推理和學(xué)習(xí)等問題的一類方法;其核心是以圖的連接關(guān)系為基礎(chǔ),提供一種高效、可視化地表示隨機(jī)變量之間條件獨立性和聯(lián)合概率分布的手段。

概率圖模型理論分為三部分內(nèi)容:概率圖模型的表示理論、推理方法和學(xué)習(xí)方法。概率圖模型的表示理論可以分為結(jié)構(gòu)表示和參數(shù)表示,目前已經(jīng)發(fā)展得比較完備。其中,結(jié)構(gòu)表示是概率圖模型的基礎(chǔ)理論,以D-分隔、Hammersely-Clifford定理等為代表,結(jié)構(gòu)表示理論揭示了聯(lián)合分布的因子化表示和條件獨立性(又稱馬爾可夫性)的等價性。根據(jù)邊的性質(zhì),概率圖模型主要分為有向無環(huán)圖模型(即貝葉斯網(wǎng)絡(luò)),無向圖模型(即馬爾可夫網(wǎng)絡(luò)或馬爾可夫隨機(jī)場),以及同時包含有向邊和無向邊的混合圖模型。模式識別問題中,常見的無向圖模型包括:條件隨機(jī)場、受限玻爾茲曼機(jī)、Ising模型等;常見的有向無環(huán)圖模型包括:隱馬爾可夫模型、混合高斯模型、隱狄利克雷分配等;常見的混合模型包括:深度置信網(wǎng)絡(luò)等。

概率圖模型的推理方法可以分為兩類:精確算法和近似算法。通常,精確推理算法只用于鏈、樹等簡單圖結(jié)構(gòu)的問題中,經(jīng)典方法包括:變量消去法、信念傳播算法、Junction Tree算法等。由于計算復(fù)雜度的原因,近似算法在實際中更加常用,現(xiàn)有方法分為兩類:基于函數(shù)逼近的變分方法,如平均場算法,迭代信念傳播算法;和基于隨機(jī)采樣的蒙特卡羅方法,如Importance Sampling, MCMC算法。采樣方法通常具有優(yōu)秀的理論性質(zhì),但速度較慢。如在MCMC方法中,當(dāng)馬氏鏈運行時間趨于無窮時所采樣本嚴(yán)格服從真實分布;但如何加快馬氏鏈的收斂一直是MCMC研究中的難題。相反,變分法速度較快,但近似效果在理論和實際中都有缺陷。近年來,為了對更加復(fù)雜的概率圖模型(如貝葉斯深度學(xué)習(xí)網(wǎng)絡(luò))進(jìn)行有效推理,傳統(tǒng)的推理算法通過與神經(jīng)網(wǎng)絡(luò)等方法的結(jié)合取得了顯著突破,如變分編解碼器等方法,不僅克服了對近似分布限制過強(qiáng)的缺陷,在速度上也取得了提升;類似的,MCMC方法也已經(jīng)充分利用神經(jīng)網(wǎng)絡(luò)的特性,發(fā)展了更加高效的采樣算法。

概率圖模型的學(xué)習(xí)可以分為結(jié)構(gòu)學(xué)習(xí)和參數(shù)學(xué)習(xí)。一般圖結(jié)構(gòu)的學(xué)習(xí)已被證明是NP-Hard問題,還沒有通用的學(xué)習(xí)算法;現(xiàn)有方法主要基于約束、搜索、動態(tài)規(guī)劃、模型平均、混合策略等。但實際中通常的做法是針對具體問題人工設(shè)計圖結(jié)構(gòu),例如,在混合高斯模型和話題模型中使用的混合加性結(jié)構(gòu),在語音識別、手寫字符串識別中使用的鏈?zhǔn)浇Y(jié)構(gòu),在圖像降噪中使用的網(wǎng)格結(jié)構(gòu)、層次化結(jié)構(gòu)等。對于參數(shù)學(xué)習(xí),極大化訓(xùn)練數(shù)據(jù)集上的似然函數(shù)是最常見的方式,但通常計算復(fù)雜度很高。出于計算效率的考慮,實際中,經(jīng)常使用其他目標(biāo)函數(shù)對似然函數(shù)進(jìn)行近似,如似然函數(shù)的變分下界(Evidence Lower Bound), Piecewise Likelihood,Pseudo Likelihood, Score Matching等。其他常見的參數(shù)學(xué)習(xí)方法還包括矩匹配(Moment-Matching)、對抗訓(xùn)練等。

概率圖模型在熱力學(xué)、統(tǒng)計學(xué)領(lǐng)域很早就有深入研究,二十世紀(jì)七八十年代,隨著隱馬爾科夫模型和馬爾可夫隨機(jī)場在語音識別和圖像復(fù)原問題上的成功應(yīng)用,概率圖模型開始在模式識別和機(jī)器學(xué)習(xí)領(lǐng)域獲得關(guān)注。如今,概率圖模型在計算機(jī)視覺、語音識別、自然語言處理、生物信息學(xué),機(jī)器人學(xué)等方向都有廣泛的應(yīng)用并產(chǎn)生了重大影響。貝葉斯網(wǎng)絡(luò)的主要提出者Judea Pearl教授還因其在概率圖模型和因果推斷領(lǐng)域的突出貢獻(xiàn)獲得了計算機(jī)領(lǐng)域的最高榮譽(yù)----圖靈獎。

10. 集成學(xué)習(xí)

集成學(xué)習(xí)是機(jī)器學(xué)習(xí)領(lǐng)域中的重要研究方向,主要研究如何構(gòu)建并結(jié)合多個基學(xué)習(xí)器來得到一個具有更好泛化性能的強(qiáng)學(xué)習(xí)器。集成學(xué)習(xí)因此又被稱為多分類系統(tǒng)(Multi-Classifier System)、基于委員會的學(xué)習(xí)(Committee-Based Learning)等。早期(20世紀(jì)80-90年代)關(guān)于集成學(xué)習(xí)的工作主要集中在對多分類器結(jié)合策略的研究上。這些結(jié)合策略主要包括簡單平均法、投票法以及基于學(xué)習(xí)的結(jié)合法。投票法主要包括絕對多數(shù)投票法(Majority Voting)、相對多數(shù)投票法(Plurlity Voting)、加權(quán)投票法(Weighted Voting)和排序投票法(如波達(dá)計數(shù)法, Borda Count)等。基于學(xué)習(xí)的結(jié)合法通過從數(shù)據(jù)中學(xué)習(xí)一種自適應(yīng)的多分類器結(jié)合策略,包括Stacking方法和貝葉斯模型平均(Bayes Model Averaging, BMA)等。此外,對多分類任務(wù)來說,將二分類學(xué)習(xí)器推廣到多類的ECOC (Error-Correcting Output Coding,糾錯編碼)也可視為一種分類器結(jié)合策略。

集成學(xué)習(xí)通常涉及兩個相關(guān)子問題:基學(xué)習(xí)器的構(gòu)建以及基學(xué)習(xí)器的結(jié)合。為得到好的集成結(jié)果,在生成基學(xué)習(xí)器時,要求基學(xué)習(xí)器具有一定準(zhǔn)確性,同時還要具有多樣性(diversity)。根據(jù)基學(xué)習(xí)器的生成方式不同,集成學(xué)習(xí)可分為并行式集成學(xué)習(xí)和串行式集成學(xué)習(xí)。Bagging是并行式集成學(xué)習(xí)的代表性方法。Bagging通過自助采樣法對樣本集進(jìn)行擾動來并行構(gòu)建多個基學(xué)習(xí)器,最后通過投票法或平均法將生成的基學(xué)習(xí)器結(jié)合起來。Bagging最著名的擴(kuò)展變體是隨機(jī)森林(Random Forest)。該方法被譽(yù)為“代表集成學(xué)習(xí)技術(shù)水平的方法”。隨機(jī)森林以決策樹為基學(xué)習(xí)器,在構(gòu)建決策樹時,額外引入屬性集擾動來增加基學(xué)習(xí)器的多樣性。串行式集成學(xué)習(xí)的代表方法是Boosting系列算法。Boosting以串行方式來依次生成基學(xué)習(xí)器,通過引入并調(diào)整樣本權(quán)重分布,使得在學(xué)習(xí)基學(xué)習(xí)器時,算法能更多的關(guān)注那些之前被錯分的樣本。Boosting起源于AdaBoost方法。從統(tǒng)計角度來看,AdaBoost可認(rèn)為是基于加性模型來分步優(yōu)化指數(shù)損失函數(shù)。對于一般形式的損失函數(shù),J. Freidman提出了GradientBoosting方法,其基本思想是基于加性模型并利用梯度下降法來對損失函數(shù)進(jìn)行優(yōu)化,當(dāng)基學(xué)習(xí)器是決策樹時就是GBDT算法。該算法的一種高效實現(xiàn)——XGBoost,目前被廣泛使用。從偏差-方差分解的角度來看,Boosting主要關(guān)注如何降低模型的偏差,而Bagging更多關(guān)注如何降低模型的方差。

目前,集成學(xué)習(xí)已成為一種重要的機(jī)器學(xué)習(xí)思想,被廣泛的應(yīng)用于聚類、分類、回歸和半監(jiān)督學(xué)習(xí)等幾乎所有的學(xué)習(xí)任務(wù)中。深度神經(jīng)網(wǎng)絡(luò)訓(xùn)練中廣泛采用的Dropout可看作是集成學(xué)習(xí)思想的一種體現(xiàn)。

集成學(xué)習(xí)的理論工作已有許多探索,例如AdaBoost起源于計算學(xué)習(xí)理論中“強(qiáng)可學(xué)習(xí)性是否等價于弱可學(xué)習(xí)性”這個重要問題,其雛形本身就是對該理論問題的構(gòu)造性證明。集成學(xué)習(xí)也產(chǎn)生了許多重要理論問題,其中最受關(guān)注的“AdaBoost為何在訓(xùn)練誤差為零后繼續(xù)訓(xùn)練很長時間仍不發(fā)生過擬合”問題最近才通過建立新的間隔理論得到徹底解決。值得注意的是,不同類型的集成學(xué)習(xí)方法的理論基礎(chǔ)仍處于分頭探索、目前尚未建立起統(tǒng)一的理論基礎(chǔ),這是一個需要深入研究的方向。另外,在使用大量基學(xué)習(xí)器進(jìn)行集成學(xué)習(xí)后會形成黑箱模型,如何提升集成學(xué)習(xí)的可解釋性也是一個值得深入研究的方向。這一方向相關(guān)的研究工作包括將集成轉(zhuǎn)化為單模型、從集成中抽取符號規(guī)則以及由此衍生的“二次學(xué)習(xí)”(twice-learning)技術(shù)、集成可視化技術(shù)等等。

11. 半監(jiān)督學(xué)習(xí)

半監(jiān)督學(xué)習(xí)是實現(xiàn)模式識別的重要途徑。發(fā)展半監(jiān)督學(xué)習(xí)方法的目的是為了解決標(biāo)注樣本不足的問題。半監(jiān)督學(xué)習(xí)方法同時利用有標(biāo)記的樣本和無標(biāo)記樣本來改善學(xué)習(xí)器的性能,因此是一種監(jiān)督學(xué)習(xí)與無監(jiān)督學(xué)習(xí)相結(jié)合的學(xué)習(xí)方法。半監(jiān)督學(xué)習(xí)的基本設(shè)置是給定一個分布未知的有標(biāo)記樣本集和一個未標(biāo)記樣本集,期望學(xué)習(xí)一個最優(yōu)的學(xué)習(xí)器對數(shù)據(jù)點的標(biāo)記進(jìn)行預(yù)測。根據(jù)不同的任務(wù)目的,半監(jiān)督學(xué)習(xí)方法可分為歸納和直推兩種類型。通過聯(lián)合利用標(biāo)記和無標(biāo)記樣本,歸納型半監(jiān)督學(xué)習(xí)方法旨在學(xué)得參數(shù)化的預(yù)測函數(shù),而直推型半監(jiān)督學(xué)習(xí)方法旨在完成對無標(biāo)記樣本的標(biāo)注。

在半監(jiān)督學(xué)習(xí)中,由于數(shù)據(jù)的分布未知,為便于充分利用未標(biāo)記樣本中的信息來建立樣本與學(xué)習(xí)目標(biāo)之間的關(guān)系,人們建立了平滑假設(shè)、聚類假設(shè)和流形假設(shè)。平滑假設(shè)認(rèn)為數(shù)據(jù)的概率密度函數(shù)是平滑的,因此位于稠密數(shù)據(jù)區(qū)域中距離相近的樣本點以大概率具有相似的標(biāo)記。聚類假設(shè)認(rèn)為屬于同一聚類簇中的樣本以大概率具有相似的標(biāo)記。對分類問題而言,在該假設(shè)下,分類決策邊界應(yīng)盡可能地位于稀疏的數(shù)據(jù)區(qū)域。流形假設(shè)認(rèn)為高維數(shù)據(jù)嵌入在低維流形中且位于該流形中同一局部鄰域內(nèi)的樣本以大概率具有相似的標(biāo)記。在上述三個假設(shè)下,大量的未標(biāo)記樣本會讓數(shù)據(jù)空間變得稠密,從而幫助學(xué)習(xí)器更好地進(jìn)行數(shù)據(jù)擬合。上述三個假設(shè)已廣泛地應(yīng)用于學(xué)習(xí)器的建立之中,形成了半監(jiān)督分類、半監(jiān)督聚類、半監(jiān)督回歸等主要研究主題。

半監(jiān)督分類方法已取得了很大進(jìn)展,并發(fā)展出了眾多的方法,主要可分為生成式模型、自訓(xùn)練、直推學(xué)習(xí)等方法。其中,生成式模型大多屬于歸納型半監(jiān)督分類方法,自訓(xùn)練的思想則在歸納和直推兩種類型的半監(jiān)督分類方法中均得到應(yīng)用。具體地,在生成式模型方面,最具有代表性的方法包含高斯混合模型、隱馬爾可夫模型、非參數(shù)密度模型、生成樹、高斯過程等。該類方法通過與期望最大化算法相結(jié)合,利用無標(biāo)記樣本來改善似然損失,提高判別函數(shù)的分類決策能力。自訓(xùn)練方法假定多個不同的學(xué)習(xí)器同時得到訓(xùn)練,并利用對無標(biāo)記樣本的一致標(biāo)注來自動地增加訓(xùn)練樣本,從而迭代地提升分類器性能,主要包含分類器協(xié)同訓(xùn)練方法、對偶協(xié)同訓(xùn)練方法、多模態(tài)協(xié)同訓(xùn)練方法、協(xié)同正則化方法、主動學(xué)習(xí)方法、自學(xué)習(xí)方法、圖協(xié)同訓(xùn)練方法、深度協(xié)同訓(xùn)練方法、深度蒸餾方法等。在直推學(xué)習(xí)方法中,最具有代表性的方法是直推支持向量機(jī)和基于圖的半監(jiān)督分類方法。直推支持向量機(jī)將支持向量機(jī)中最大間隔分類器構(gòu)建思想同時應(yīng)用于標(biāo)記樣本和無標(biāo)記樣本來提高分類器的泛化能力?;趫D的半監(jiān)督分類方法以標(biāo)記樣本和無標(biāo)記樣本為圖的頂點進(jìn)行圖構(gòu)建,并以流形假設(shè)為基礎(chǔ)構(gòu)建學(xué)習(xí)模型?;趫D的半監(jiān)督分類方法包含馬爾可夫隨機(jī)場、隨機(jī)游走、高斯隨機(jī)場半監(jiān)督分類、流形正則化半監(jiān)督分類、局部和全局一致性半監(jiān)督分類、半監(jiān)督近鄰傳播方法、局部線性嵌入半監(jiān)督分類、局部線性回歸半監(jiān)督分類、局部樣條回歸半監(jiān)督分類、圖正則化核嶺回歸等方法。其中,圖正則化核嶺回歸能夠輸出一個參數(shù)化的分類判別函數(shù)。

與半監(jiān)督分類方法取得進(jìn)展的同時,半監(jiān)督聚類也獲得了相應(yīng)發(fā)展。半監(jiān)督聚類主要通過在現(xiàn)有算法的聚類過程中利用給定的少量監(jiān)督信息來實現(xiàn)。監(jiān)督信息一般以樣本的類別標(biāo)簽、點對相似或不相似等形式呈現(xiàn)。典型方法包含種子/約束K均值聚類、約束層次聚類、隱馬爾可夫隨機(jī)場半監(jiān)督聚類、局部線性度量自適應(yīng)、線束非負(fù)矩陣分解、半監(jiān)督因子分析、主動成對約束聚類、約束距離度量學(xué)習(xí)聚類、約性約束最大間隔聚類、用戶反饋聚類、半監(jiān)督核學(xué)習(xí)聚類、半監(jiān)督核均值移動聚類、特征投影半監(jiān)督聚類、圖半監(jiān)督聚類等、半監(jiān)督異構(gòu)進(jìn)化聚類、半監(jiān)督深度學(xué)習(xí)聚類,等等。另外,半監(jiān)督回歸方法也取得了進(jìn)展,代表性方法包含標(biāo)簽約束半監(jiān)督線性回歸、半監(jiān)督局部線性回歸、半監(jiān)督核嶺回歸、半監(jiān)督支持向量機(jī)回歸、半監(jiān)督譜回歸、半監(jiān)督高斯過程回歸、半監(jiān)督樣條回歸、半監(jiān)督序回歸、半監(jiān)督多任務(wù)回歸、協(xié)同訓(xùn)練回歸,等等。除了以上脫機(jī)式半監(jiān)督學(xué)習(xí)方法之外,半監(jiān)督魯棒聯(lián)機(jī)聚類、并行式圖半監(jiān)督學(xué)習(xí)等聯(lián)機(jī)、分布與并行式半監(jiān)督學(xué)習(xí)方法也得到了發(fā)展。

最近,隨著深度學(xué)習(xí)的興起,半監(jiān)督深度學(xué)習(xí)也以各種形式出現(xiàn)。利用受限玻爾茲曼機(jī)和自編碼機(jī)的預(yù)訓(xùn)練方式成為訓(xùn)練大型神經(jīng)網(wǎng)絡(luò)的重要手段。隨后,階梯網(wǎng)絡(luò)成為標(biāo)志性的半監(jiān)督分類神經(jīng)網(wǎng)絡(luò)。半監(jiān)督自編碼機(jī)、半監(jiān)督生成對抗網(wǎng)絡(luò)得到了廣泛的研究。同時,基于圖卷積神經(jīng)網(wǎng)絡(luò)的半監(jiān)督分類算法進(jìn)一步拓展了深度半監(jiān)督學(xué)習(xí)方法。

半監(jiān)督學(xué)習(xí)是本世紀(jì)初模式識別與機(jī)器學(xué)習(xí)中的重要進(jìn)展,豐富了模式分類的手段和方法體系,促進(jìn)了分類器構(gòu)造、聚類分析、維數(shù)縮減、特征選擇、距離度量學(xué)習(xí)、遷移學(xué)習(xí)等基本問題的研究。半監(jiān)督學(xué)習(xí)在交互式圖像分割、文本分類、信息檢索、生物特征識別、生物信息處理、遙感圖像理解等諸多模式識別任務(wù)中得到了廣泛應(yīng)用。

12. 遷移學(xué)習(xí)

遷移學(xué)習(xí)是機(jī)器學(xué)習(xí)中一類特殊的學(xué)習(xí)方式,具體是指利用數(shù)據(jù)、任務(wù)、模型等之間的相似性,將在一個領(lǐng)域(源域)的學(xué)習(xí)結(jié)果應(yīng)用到另一領(lǐng)域(目標(biāo)域)中的學(xué)習(xí)過程。通過遷移學(xué)習(xí),可以有效提升學(xué)習(xí)器對新數(shù)據(jù)的自適應(yīng)能力,充分利用已有數(shù)據(jù)和知識,減少對大量訓(xùn)練數(shù)據(jù)和大規(guī)模計算資源的依賴,提高學(xué)習(xí)效率和準(zhǔn)確性。

遷移學(xué)習(xí)方法大致可以分為四類。第一類是基于樣本遷移的方法,核心思想是通過加權(quán)重用的手段,在目標(biāo)域中有選擇地使用源域中數(shù)據(jù)。如早期工作中使用解決有偏采樣的方法對源域樣本進(jìn)行重加權(quán)來模擬目標(biāo)域樣本。TrAdaboost方法基于Adaboost算法,根據(jù)是否有利于目標(biāo)域分類,雙向調(diào)節(jié)源域樣本在目標(biāo)域中的權(quán)重,從而實現(xiàn)有選擇地樣本遷移。核均值匹配方法使加權(quán)的源域樣本與目標(biāo)域樣本分布盡可能一致,實現(xiàn)樣本遷移。第二類是基于特征表示遷移的方法,核心思想是學(xué)習(xí)一種新的特征表示,使源域和目標(biāo)域的樣本間差異在該表示下最小,從而源域的數(shù)據(jù)可在目標(biāo)域中使用。如譜特征對齊方法以中心特征為橋梁,將源域和目標(biāo)域特征用譜聚類進(jìn)行統(tǒng)一。遷移成分分析方法以最大均值差異為準(zhǔn)則,將不同數(shù)據(jù)領(lǐng)域中的分布差異最小化。由于深度學(xué)習(xí)的核心任務(wù)是特征學(xué)習(xí),因此大多針對深度神經(jīng)網(wǎng)絡(luò)模型的遷移學(xué)習(xí)方法屬于該類。如最簡單的也是最常用的Finetune方法,直接利用已在其他任務(wù)上預(yù)訓(xùn)練好的網(wǎng)絡(luò)進(jìn)行訓(xùn)練,可以極大地節(jié)省訓(xùn)練時間和樣本。生成對抗網(wǎng)絡(luò)的思想也可用于遷移學(xué)習(xí),在領(lǐng)域?qū)股窠?jīng)網(wǎng)絡(luò)中,引入領(lǐng)域?qū)狗种沟脙捎驑颖窘?jīng)過特征提取網(wǎng)絡(luò)后無法區(qū)分其來自哪個域,從而將兩域特征統(tǒng)一。第三類是基于模型遷移的方法,通過構(gòu)建參數(shù)共享模型并實施參數(shù)約束,促使有效的參數(shù)信息從源域傳遞到目標(biāo)域中。例如假定SVM的權(quán)重向量由兩部分加和組成,其中一部分由源域和目標(biāo)域共享。此外,遷移深度神經(jīng)網(wǎng)絡(luò)中的特征共享大多是通過共享網(wǎng)絡(luò)結(jié)構(gòu)實現(xiàn)的,因此這些方法實際也可以看作模型和特征遷移相結(jié)合的方法。第四類是基于關(guān)系遷移的方法,該類方法用得較少,主要是挖掘和利用關(guān)系進(jìn)行類比遷移。如有借助馬爾科夫邏輯網(wǎng)絡(luò)挖掘不同領(lǐng)域之間關(guān)系相似性的幾個工作。除方法研究以外,遷移學(xué)習(xí)的理論研究也取得部分成果,用來解釋遷移學(xué)習(xí)的可行性以及可行條件等,目前取得的成果建立了領(lǐng)域間差異與目標(biāo)域泛化界之間的關(guān)系。當(dāng)前遷移學(xué)習(xí)研究的一個新趨勢是動態(tài)數(shù)據(jù)流上的連續(xù)遷移學(xué)習(xí),此時數(shù)據(jù)不能簡單地劃分為源域和目標(biāo)域,而是連續(xù)動態(tài)變化或者有多個域,或者域之間的界限不清楚,對這種非靜態(tài)數(shù)據(jù)流的自適應(yīng)和遷移學(xué)習(xí)將顯著提升系統(tǒng)的實際魯棒性。

遷移學(xué)習(xí)是人類自然掌握的一種學(xué)習(xí)方式,很早就有哲學(xué)家和心理學(xué)家提出相關(guān)的概念,在機(jī)器學(xué)習(xí)領(lǐng)域中的起源可以追溯到1995年NIPS上關(guān)于Learning to Learn的Workshop,之后一直是學(xué)界的一個研究熱點。遷移學(xué)習(xí)的研究起步相對較晚。人們從不同視角面向不同的情形提出了大量的算法,并在領(lǐng)域自適應(yīng)、元學(xué)習(xí)、終身學(xué)習(xí)等方向取得重要進(jìn)展。其中,領(lǐng)域自適應(yīng)是非?;钴S的一個方向,通常特指源域與目標(biāo)域的樣本分布或特征表示之間存在差異而任務(wù)類型相同的情形,監(jiān)督信息一般全部來自源域,通過特定的變換使其自適應(yīng)到目標(biāo)域中為之所用,是遷移學(xué)習(xí)中最常見的一類方法。遷移學(xué)習(xí)的應(yīng)用也十分廣泛,包括但不限于計算機(jī)視覺、文本分類、行為識別、自然語言處理、時間序列分析、視頻監(jiān)控、輿性分析、人機(jī)交互等,遷移學(xué)習(xí)在這些領(lǐng)域中發(fā)揮著重要的作用。

13. 多任務(wù)學(xué)習(xí)

多任務(wù)學(xué)習(xí)是機(jī)器學(xué)習(xí)中的一類重要方法,它是指給定一批學(xué)習(xí)任務(wù),其中全部或者部分任務(wù)是相關(guān)的,通過聯(lián)合學(xué)習(xí)這批任務(wù)來提升各個任務(wù)的性能。多任務(wù)學(xué)習(xí)最常被用于訓(xùn)練樣本稀少的情況,通過信息在任務(wù)間的相互傳遞,每個任務(wù)都從其他任務(wù)獲得了更多的樣本信息,從而減輕因樣本稀少造成的過擬合,提高學(xué)習(xí)性能。多任務(wù)學(xué)習(xí)與遷移學(xué)習(xí)密切相關(guān),它們都涉及到學(xué)習(xí)任務(wù)間的相互幫助,但信息流動方向的差異使得他們的實現(xiàn)方法有著明顯差異。此外,多標(biāo)簽學(xué)習(xí)可以看作多任務(wù)學(xué)習(xí)的一種特殊情況。

根據(jù)任務(wù)間共享內(nèi)容的不同,多任務(wù)學(xué)習(xí)方法大致可以分為以下幾類。第一類是基于特征共享的方法,即不同任務(wù)共享部分或全部特征。Caruana在1997年最早提出的多任務(wù)學(xué)習(xí)策略即屬此類方法。在該項工作中,任務(wù)相關(guān)的淺層神經(jīng)網(wǎng)絡(luò)共享同一個隱含層,但各任務(wù)使用獨立的輸出層,從而實現(xiàn)了公共特征的提??;同時,通過構(gòu)造輔助學(xué)習(xí)任務(wù)來與主任務(wù)共享特征,幫助提升主任務(wù)的性能。這些樸素的多任務(wù)學(xué)習(xí)思想至今仍然被廣泛地應(yīng)用在相關(guān)領(lǐng)域中,特別是對于深度神經(jīng)網(wǎng)絡(luò),很容易實現(xiàn)特征共享。例如,將人臉識別任務(wù)與人臉認(rèn)證任務(wù)聯(lián)合學(xué)習(xí),共享特征提取層,從而提高特征提取質(zhì)量并提升兩個任務(wù)的性能。再如在臉部特征點檢測任務(wù)中,設(shè)計與之相關(guān)的輔助任務(wù),如判斷是否戴眼鏡、判斷是否是笑容、性別分類、姿態(tài)分類等,令它們共享特征并聯(lián)合學(xué)習(xí),利用輔助任務(wù)標(biāo)簽帶來的額外信息,提高了主任務(wù)特征點檢測的性能。近年來,學(xué)術(shù)界基于該思想提出了很多改進(jìn)方法,以更加靈活地共享特征,如十字繡網(wǎng)絡(luò)可自動學(xué)習(xí)網(wǎng)絡(luò)共享層數(shù),全自適應(yīng)特征共享方法可自動發(fā)現(xiàn)最優(yōu)的多任務(wù)網(wǎng)絡(luò)結(jié)構(gòu)等。針對非神經(jīng)網(wǎng)絡(luò)模型,基于特征共享的方法包括聯(lián)合特征選擇和聯(lián)合特征變換等,采取的手段包括利用結(jié)構(gòu)化稀疏約束(如矩陣2,1-范數(shù))實現(xiàn)聯(lián)合降維等。第二類方法是基于參數(shù)共享的方法,即假設(shè)這些任務(wù)的參數(shù)之間以某種形式發(fā)生了共享,并根據(jù)共享形式施加相應(yīng)的約束。最常見的如低秩假設(shè),用nuclear norm對參數(shù)矩陣進(jìn)行正則化,以使得到的參數(shù)矩陣具有較低的秩,即將這些任務(wù)的參數(shù)限制在一個維數(shù)較低的子空間中。當(dāng)每個任務(wù)具有多個輸出時,由于每個任務(wù)的參數(shù)是一個矩陣,則基于張量分解對以上方法進(jìn)行擴(kuò)展。另一種參數(shù)共享形式是空間聚類,最簡單的一個假設(shè)是每個任務(wù)由公共部分和個體部分組成,直接基于該假設(shè)建模,便得到均值正則化多任務(wù)學(xué)習(xí)方法。更進(jìn)一步,假設(shè)這些任務(wù)聚成多個簇,每個簇內(nèi)的任務(wù)共享一個公共部分,同時學(xué)習(xí)多個任務(wù)和聚類方式,便得到了任務(wù)自主聚類方法。多任務(wù)關(guān)系學(xué)習(xí)則假設(shè)所有任務(wù)都服從矩陣正態(tài)分布,在學(xué)習(xí)過程中自動學(xué)習(xí)描述任務(wù)間相關(guān)性的任務(wù)協(xié)方差矩陣。還有其他一些基于更復(fù)雜的假設(shè)的多任務(wù)學(xué)習(xí)方法,大多通過引入合適的約束得以實現(xiàn)。有關(guān)多任務(wù)學(xué)習(xí)的理論研究也一直受到關(guān)注,學(xué)者主要研究多任務(wù)學(xué)習(xí)起作用的機(jī)制以及理論保證,解釋多任務(wù)學(xué)習(xí)如何提高學(xué)習(xí)模型的泛化性。

多任務(wù)學(xué)習(xí)自從提出以來,就受到了學(xué)界的重視,它不僅豐富了機(jī)器學(xué)習(xí)理論,而且在實際應(yīng)用中發(fā)揮了重要的作用,包括計算機(jī)視覺、生物信息學(xué)、健康信息學(xué)、語音分析、自然語言處理、網(wǎng)絡(luò)應(yīng)用和普適計算等應(yīng)用領(lǐng)域,有效地緩解了單一任務(wù)訓(xùn)練樣本不足時的過擬合問題,提高了各自的性能。此外多任務(wù)學(xué)習(xí)可以與其他很多學(xué)習(xí)方法有機(jī)結(jié)合,提高它們的性能。


能看到這里人應(yīng)該炒雞厲害吧...

歡迎大家評論區(qū)交流


權(quán)威整理|模式識別基礎(chǔ)重要研究進(jìn)展(二)的評論 (共 條)

分享到微博請遵守國家法律
昭平县| 永泰县| 广昌县| 禹州市| 华亭县| 舒城县| 衡阳市| 美姑县| 碌曲县| 阳城县| 蒙城县| 册亨县| 略阳县| 尼玛县| 汉中市| 尼木县| 弥勒县| 芦山县| 平乐县| 靖西县| 广元市| 来凤县| 卢氏县| 宁德市| 衡阳市| 玉林市| 莱西市| 洪泽县| 中阳县| 庆城县| 潮州市| 漳浦县| 昌平区| 理塘县| 安义县| 乌兰浩特市| 古田县| 天长市| 克拉玛依市| 从江县| 句容市|