R語言自適應(yīng)平滑樣條回歸分析
原文鏈接:http://tecdat.cn/?p=14854?
?
一種類型的平滑稱為樣條平滑。柔性金屬(通常是鉛),可以用作繪制平滑曲線的參考。將選擇一組點(diǎn)(稱為結(jié)),然后將樣條線壓在特定的x,y點(diǎn),然后彎曲以通過下一個(gè)點(diǎn),依此類推。由于金屬的柔韌性,此過程將生成通過這些點(diǎn)的平滑曲線。
?
在數(shù)學(xué)上,可以通過選擇結(jié)點(diǎn)并使用(通常是三次)回歸來估計(jì)結(jié)之間的點(diǎn),并使用演算來確保每條單獨(dú)的回歸線連接在一起時(shí)曲線都平滑,從而重現(xiàn)該過程。平滑的程度由參數(shù)控制,通常在0和1之間的范圍內(nèi)。
為了說明,我們考慮由來自1910至2004年的小麥產(chǎn)量數(shù)據(jù)集?。
生成數(shù)據(jù)圖,并疊加樣條曲線平滑度。
>?plot(wheat$year,wheat$production)
>?lines(smooth.spline(wheat$year,wheat$production))
結(jié)果如下:

應(yīng)用的平滑量??由參數(shù)?spar?控制??。我們檢查效果:
sapply(spars,plotfn)
該圖顯示如下:

自適應(yīng)平滑算法
盡管大多數(shù)平滑器需要指定帶寬,數(shù)據(jù)部分或平滑級別,但超級平滑的不同之處在于它可以自行解決這些問題。因此,它是需要平滑處理而無需任何用戶干預(yù)的情況的絕佳選擇。Supersmoother通過執(zhí)行許多簡單的局部回歸平滑來工作,并且在每個(gè)x值處,它使用這些平滑來確定要使用的最佳y值。在R中,可通過?supsmu??函數(shù)獲得?超級平滑器。
為了說明這一點(diǎn),考慮汽車數(shù)據(jù)。以下幾行產(chǎn)生了?重量?與??MPG的關(guān)系圖,并疊加了一條超平滑線。
該圖顯示如下:

?
帶有面板的平滑算法
在使用點(diǎn)陣圖形時(shí),我們已經(jīng)看到了?panel.lmline?的使用??,它在點(diǎn)陣圖的每個(gè)面板中顯示最佳回歸線??梢允褂妙愃频暮瘮?shù)??panel.loess?在圖的每個(gè)面板中疊加局部加權(quán)回歸平滑器。作為簡單說明,考慮內(nèi)置的??Orange??數(shù)據(jù)集,其中包含有關(guān)幾棵橙樹的年齡和周長的信息。首先,讓我們看一幅具有最佳回歸線平滑度的圖,該圖疊加在?每?棵樹的年齡?與?周長圖上??:
要?jiǎng)?chuàng)建相同的圖,但要使用??panel.loess??函數(shù),可以使用以下代碼:
>?xyplot(circumference~age|Tree,
+??????? ...)})
?

?
如果?您想讓它更平滑,可以使用??panel.lines??函數(shù)直接繪制它:
>?xyplot(circumference~age|Tree,
+?? ,...)})
?


參考文獻(xiàn)
1.用SPSS估計(jì)HLM層次線性模型模型
2.R語言線性判別分析(LDA),二次判別分析(QDA)和正則判別分析(RDA)
3.基于R語言的lmer混合線性回歸模型
4.R語言Gibbs抽樣的貝葉斯簡單線性回歸仿真分析
5.在r語言中使用GAM(廣義相加模型)進(jìn)行電力負(fù)荷時(shí)間序列分析
6.使用SAS,Stata,HLM,R,SPSS和Mplus的分層線性模型HLM
7.R語言中的嶺回歸、套索回歸、主成分回歸:線性模型選擇和正則化
8.R語言用線性回歸模型預(yù)測空氣質(zhì)量臭氧數(shù)據(jù)
9.R語言分層線性模型案例