如何自動開展logistic先單后多回歸分析?

2023年鄭老師多門科研統(tǒng)計(jì)課程:多次直播,含孟德爾隨機(jī)化方法? ??

在醫(yī)學(xué)科研、特別是觀察性研究領(lǐng)域,無論是現(xiàn)況調(diào)查、病例對照研究、還是隊(duì)列研究,經(jīng)常遇到二分類指標(biāo),大家也都知道使用logistic開展回歸分析,使用先單后多法來篩選自變量。
實(shí)際中,許多人習(xí)慣性使用SPSS進(jìn)行回歸分析,但是SPSS無法使單因素結(jié)果與多因素結(jié)果在同一張表格中,手動繪制三線表既費(fèi)時又費(fèi)力。而R語言雖然可以解決以上難點(diǎn)但具有一定的門檻,因此,這里結(jié)合一篇文獻(xiàn)與實(shí)操案例為大家介紹一個智能在線免費(fèi)統(tǒng)計(jì)分析平臺——風(fēng)暴統(tǒng)計(jì)。

一、實(shí)操數(shù)據(jù)介紹
這里我們使用的是R語言自帶數(shù)據(jù)集MASS中的birthwt,birthwt是一份與嬰兒出生體重低相關(guān)的危險(xiǎn)因素?cái)?shù)據(jù),其中包含的變量見下表,根據(jù)研究設(shè)計(jì),以“l(fā)ow”作為結(jié)局變量。

二、風(fēng)暴統(tǒng)計(jì)智能在線免費(fèi)平臺復(fù)現(xiàn)
(1)進(jìn)入風(fēng)暴統(tǒng)計(jì)網(wǎng)站的“風(fēng)暴智能統(tǒng)計(jì)”模塊,點(diǎn)擊“l(fā)ogistic回歸分析”

(2)導(dǎo)入數(shù)據(jù),目前支持10M以內(nèi)的csv格式。數(shù)據(jù)導(dǎo)入前如需進(jìn)行預(yù)處理的(如:定量數(shù)據(jù)轉(zhuǎn)分類數(shù)據(jù)、多分類轉(zhuǎn)二分類、打標(biāo)簽等),推薦用SPSS進(jìn)行操作,具體詳見下方文章:
如何結(jié)合SPSS與在線統(tǒng)計(jì)分析平臺來撰寫論文?

(4)指定因變量與自變量的變量類型

(5)指定logistic回歸方式
這里選用先單后多的篩選方式,這個方法比較傳統(tǒng)也是大家習(xí)慣性用的比較多的,P值的限定大家可以根據(jù)自己的研究設(shè)計(jì),選擇0.05、0.1、0.2。

(6)導(dǎo)出word版三線表結(jié)果
風(fēng)暴統(tǒng)計(jì)結(jié)果結(jié)果展示如下,直接生成word版三線表,高效快速!

三、R語言軟件復(fù)現(xiàn)
這里采用autoReg包,autoReg包是一款功能十分強(qiáng)大的R包,不僅可以快捷完成基線表的制作,還可以直接一行代碼輸出回歸分析(支持線性模型、廣義線性模型和比例風(fēng)險(xiǎn)模型)的表格。
(1)logistic回歸模型構(gòu)建
使用glm() 函數(shù)構(gòu)建回歸模型,glm(y~x1+x2+x3+x4+x......,data=數(shù)據(jù)集名,family="binomial"),指定因變量與自變量,設(shè)置數(shù)據(jù)集名。
logfit<-glm(low ~ age + lwt + race + smoke + ptd + ht + ui + ftv,data=bwt,family = "binomial")
summary(logfit)
此處參數(shù)family規(guī)定了回歸模型的類型:family="binomial"指適用于二元離散因變量(binary)。
(2)先單后多
logreg3<-autoReg(logfit,uni=TRUE,threshold=0.05)
logreg3
logtable3<-myft(logreg3)

四、總結(jié)
通過對比,風(fēng)暴統(tǒng)計(jì)與R語言先單后多的分析結(jié)果完全一致,風(fēng)暴統(tǒng)計(jì)對于P值還有單獨(dú)成列,結(jié)果更加清晰直觀,大家也可以來試一試哦!