機(jī)器學(xué)習(xí)經(jīng)典算法:時(shí)間序列ARIMA模型

平穩(wěn)性:要求序列的均值和方差不發(fā)生明顯變化。
分為嚴(yán)平穩(wěn)(白噪聲)和弱平穩(wěn),一般要求達(dá)到弱平穩(wěn)。即期望與相關(guān)系數(shù)(依賴性)不變:未來某時(shí)刻的t值Xt就要依賴于它的過去信息,所以需要依賴性。
方法:差分法-時(shí)間序列在t與t-1時(shí)刻的差值(差分階數(shù)越高一般越平穩(wěn),最多二階)
ARIMA模型
自回歸模型AR:描述當(dāng)前值與歷史值之間的關(guān)系,必須滿足平穩(wěn)性、自相關(guān)性(自相關(guān)系數(shù)<0.5則不宜采用)。

移動(dòng)平均模型(MA):關(guān)注AR中的誤差項(xiàng)的累加。

自回歸移動(dòng)平均模型(ARMA):AR與MA結(jié)合。

其中,p(AR的階數(shù)) q(MA的階數(shù))都需指定。
ARIMA(p,d,q):


如何確定p q值
自相關(guān)函數(shù)ACF

Pk的取值范圍[-1,1]
偏自相關(guān)函數(shù)PACF


ARIMA建模流程:
一、將序列平穩(wěn)(差分法確定d)
二、p和q階數(shù)確定:ACF與PACF
三、調(diào)用模型ARIMA(p,d,q)
參數(shù)選擇
模型評(píng)估的指標(biāo):選擇最簡(jiǎn)單的模型
AIC赤池信息準(zhǔn)則
BIC貝葉斯信息準(zhǔn)則 越低越好
即k(模型參數(shù)個(gè)數(shù))越小越好,L(極大似然估計(jì))越大越好。

標(biāo)簽: