国产精品天干天干,亚洲毛片在线,日韩gay小鲜肉啪啪18禁,女同Gay自慰喷水

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

機器學(xué)習(xí)預(yù)測原發(fā)性前列腺癌的臨床結(jié)果,掌握這個思路,8分文章不在話下!

2023-07-14 10:29 作者:小云愛生信  | 我要投稿

爾云間? 一個專門做科研的團隊

原創(chuàng)?小果?生信果

歡迎點贊+收藏+關(guān)注

今天小果發(fā)現(xiàn)了一篇題為A machine learning framework develops a DNA replication stress model for predicting clinical outcomes and therapeutic vulnerability in primary prostate cancer(基于機器學(xué)習(xí)框架開發(fā)DNA復(fù)制應(yīng)激模型以用于預(yù)測原發(fā)性前列腺癌的臨床結(jié)果及治療易感性DOI: 10.1186/s12967-023-03872-7),該文發(fā)表于Journal of Translational Medicine(IF=8.44)。讓小果帶你來看看這篇文章的主要研究內(nèi)容吧!


一、?研究流程


二、?主要結(jié)果

1.?鑒定TCGA-PRAD中的DNA復(fù)制應(yīng)激相關(guān)特征

從982個DNA復(fù)制應(yīng)激特征中共收集了21個基因,在TCGA-PRAD中回收了894個基因。單變量cox回歸分析在TCGA-PRAD數(shù)據(jù)集中確定了198個與PCa生化復(fù)發(fā)顯著相關(guān)的基因。bootstrap方法進一步選擇了136個預(yù)后基因中的198個,采用Boruta算法,將選定的基因縮小到47個(圖1A, B),對基因進行排名, EMD,HJURP,PLK5,TROAP和CENPK這5個基因位于前5(圖2A),并在TCGA-PRAD的復(fù)發(fā)性PCa樣品中具有更高的mRNA表達(圖1C)。

圖1?Boruta算法選出的基因進行單變量Cox回歸分析的結(jié)果

圖2通過機器學(xué)習(xí)基準測試,建立了一個穩(wěn)定的DNA復(fù)制應(yīng)激標志(RSS)


2.?DNA復(fù)制應(yīng)激特征的構(gòu)建

對7種與生存相關(guān)的機器學(xué)習(xí)算法進行了基準測試,包括Enet,lasso,Ridge,XGBoost,plsRcox,SuperPC和CoxBoost,以篩選具有最佳準確性和較低過度擬合風險的超參數(shù)調(diào)整模型。在TCGA-PRAD中執(zhí)行了嵌套CV,外部10折用于驗證,內(nèi)部5折用于超參數(shù)調(diào)整(圖2B-D),XGBoost生存模型表現(xiàn)最佳。將具有調(diào)優(yōu)超參數(shù)的XGBoost模型擬合到整個TCGA-PRAD數(shù)據(jù)集中,并稱為RSS。推斷的特征包括EMD, CCNE2, PTTG1, TROAP和TK1在內(nèi)對RSS的貢獻如圖2E.


3.?DNA復(fù)制應(yīng)激特征的評估

對TCGA-PRAD訓(xùn)練隊列和四個外部驗證隊列使用1年AUC、3年AUC、5年AUC和C-index,檢查RSS的預(yù)后價值,結(jié)果表明RSS在驗證數(shù)據(jù)集中表現(xiàn)出了強大的預(yù)測能力(圖3A-E)。進行了單因素和多因素Cox回歸分析,并發(fā)現(xiàn)RSS作為一個連續(xù)變量在所有數(shù)據(jù)集中都與生化復(fù)發(fā)時間短相關(guān),因此被認為是前列腺癌復(fù)發(fā)的獨立風險因素(圖3F)。使用“SurvivalROC” R軟件包測試了是否可以使用固定的RSS閾值將所有包括的前列腺癌患者分為高危和低危兩組(圖3G-K)。綜合看來RSS有潛力為原發(fā)性前列腺癌的離散風險分層提供幫助。

圖3在多個隊列中評估DNA復(fù)制應(yīng)激簽名(RSS)


4.?RSS與臨床變量和已發(fā)表特征的比較

??使用C指數(shù)將Gleason評分、血清PSA和TNM分期其與RSS進行比較。RSS在TCGA-PRAD和GSE70768數(shù)據(jù)集中的預(yù)測準確度優(yōu)于大多數(shù)臨床特征,在DKFZ-PRAD、GSE70769和GSE94767數(shù)據(jù)集中具有不劣的預(yù)測能力(圖4A-E)。

圖4比較DNA復(fù)制應(yīng)激標記(RSS)與臨床特征和預(yù)后標記的預(yù)測表現(xiàn)


5.?TCGA-PRAD 中 RSS 高組和低 RSS 組的多組學(xué)比較

在 RSS 高組中檢測到復(fù)發(fā)的 (圖5A)拷貝數(shù)增加和 (圖5B) 拷貝數(shù)刪除區(qū)域,在 RSS 低組中檢測到復(fù)發(fā)的(圖5C)拷貝數(shù)增加和(圖5D) 拷貝數(shù)刪除區(qū)域。圖5E 顯示了受復(fù)發(fā)性拷貝數(shù)改變影響的基因的癌基因圖譜,右側(cè)的條形圖顯示了每組中變化比例的對應(yīng)比例。(圖5F)顯示了常見體細胞基因突變的癌基因圖譜,右側(cè)的條形圖顯示了每組中體細胞突變的對應(yīng)比例。圖5G-I 分別顯示了 TCGA-PRAD 數(shù)據(jù)集中 RSS 高和 RSS 低患者的錯亂分數(shù)、腫瘤突變負荷和腫瘤新抗原負荷的分布情況。盒子的上下界代表 75% 和 25% 百分位數(shù),而盒子中心線表示中位數(shù),星號表示統(tǒng)計 P 值(*P?<?0.05; **P?<?0.01; ***P?<?0.001, ****P?<?0.0001)。

圖5?RSS 高和 RSS 低患者的多組學(xué)表征


6.?RSS與臨床特征和生物學(xué)過程的關(guān)聯(lián)

比較了所有隊列中RSS高組和RSS低組的臨床特征,使用ssGSEA研究了RSS對生物途徑的影響。熱圖的上部分顯示了RSS高組和RSS低組患者之間臨床特征的分布,熱圖的下部分展示了單樣本基因集富集分析的z分數(shù),右側(cè)文本注釋的不同顏色表示相應(yīng)組中通路的相對富集程度,左側(cè)的注釋表示統(tǒng)計學(xué)P值。

圖6臨床病理學(xué)和生物特征與復(fù)制應(yīng)激標志的關(guān)聯(lián)。

7.??RSS與免疫微環(huán)境的關(guān)聯(lián)

利用CIBERSORT量化了905個PCa樣本中的免疫細胞浸潤,并研究了RSS與免疫浸潤之間的關(guān)聯(lián)。圖7A為CIBERSOR分析結(jié)果,圖7B為RSS和CD8+ T細胞之間的散點圖,圖7C為RSS和調(diào)節(jié)性T細胞之間的散點圖。D為RSS和M2型巨噬細胞之間的散點圖,相關(guān)系數(shù)R和相應(yīng)的P值來自Spearman等級相關(guān)分析。E為RSS高和RSS低患者的免疫相關(guān)基因表達。F為atezolizumab應(yīng)答者和非應(yīng)答者之間RSS分布的比較。G為RSS高和RSS低組中應(yīng)答者和非應(yīng)答者的百分比。F和G中,"R"代表應(yīng)答者,"NR"代表非應(yīng)答者。方框的上限和下限分別表示75%和25%的百分位數(shù),而方框中心線表示中位數(shù),星號表示統(tǒng)計P值(*P <0.05; **P <0.01; ***P <0.001,****P <0.0001)。

圖7復(fù)制應(yīng)激標記與免疫細胞浸潤之在Meta-cohort中的關(guān)聯(lián)


8.?在計算機中發(fā)現(xiàn)RSS高PCa患者的潛在靶點和藥物

圖8A-B為Spearman等級相關(guān)分析得到的RSS與可藥物化mRNA表達之間的相關(guān)系數(shù)點圖,其中A為TCGA-PRAD數(shù)據(jù)集,B為DKFZ-PRAD數(shù)據(jù)集。淺色點表示在Spearman等級相關(guān)分析中通過閾值篩選的潛在靶點(R > 0.3且調(diào)整P < 0.05),而深色點則表示通過CERES分析篩選出的靶點。C為在前列腺癌細胞系中鑒定出的靶點的CERES得分分布。D為CMap分析所選的化學(xué)物質(zhì)組成,只顯示前10個藥物類別。E和F為在TCGA-PRAD和DKFZ-PRAD數(shù)據(jù)集中比較了伊立替康和托泊替康在RSS高和RSS低患者之間推斷的AUC值。G和H為在TCGA-PRAD和DKFZ-PRAD數(shù)據(jù)集中比較了ADT、紫杉醇和PARP抑制劑在RSS高和RSS低患者之間推斷的AUC值。箱形圖中的上下邊界代表第75和25百分位數(shù),而箱體中心線表示中位數(shù)。星號表示統(tǒng)計P值(*P < 0.05;**P < 0.01;***P < 0.001;****P < 0.0001)。


9.?敲除FEN1和RFC5抑制細胞生長

選擇FEN1和RFC5進行實驗驗證,F(xiàn)EN1和RFC5可以通過促進細胞生來促進前列腺癌的進展。在 A 實時 qPCR 和 B 蛋白質(zhì)印跡分析中測量的 siRNA 敲低可降低 C1-4B 和 PC-2 中 FEN3 和 RFC 表達的水平。通過C CCK-1和D集落形成測定比較C5-4B和PC-2中對照,F(xiàn)EN3和RFC8敲低組之間的細胞生長。E 通過流式細胞術(shù)測量對照組、FEN1 和 RFC5 敲低組中的細胞凋亡。用膜聯(lián)蛋白V-熒光素5-異硫氰酸酯/ PI測定法對細胞進行染色。星號表示統(tǒng)計 P 值 (*P < 0.05; **P < 0.01; ***P < 0.001, ****P < 0.0001)


三、?文章小結(jié)

本篇文章內(nèi)容十分豐富,先篩選出特征數(shù)據(jù)用于機器訓(xùn)練、測試及優(yōu)化并獲得可靠的預(yù)測模型,然后對RSS進行多組學(xué)分析并識別預(yù)測與DNA復(fù)制應(yīng)激相關(guān)的靶點和治療藥物,最后進行基因敲除的驗證了預(yù)測結(jié)果的可靠性。


后記:

機器學(xué)習(xí)+生信+濕實驗驗證,8分文章發(fā)文思路get!

我們提供云生信平臺(云生信 ?- 學(xué)生物信息學(xué) (biocloudservice.com)),文章中用到的生信方法可以用它試試哦~


生信人R語言學(xué)習(xí)必備

立刻擁有一個Rstudio賬號

開啟升級模式吧

(56線程,256G內(nèi)存,個人存儲1T)

往期代碼:

【1】lncRNA的拷貝數(shù)變異下游相關(guān)分析
【2】R可視化:ggstatsplot包—科研界的美圖秀秀
【3】隨機森林算法用于分類預(yù)測和篩選診斷標志物
【4】基于本地Java版GSEA的輸出結(jié)果整合多個通路到一張圖
【5】基于嶺回歸模型和基因表達矩陣估算樣本對藥物反應(yīng)的敏感性
【6】基于R包NMF對樣本進行分型分析
【7】DALEX包用于探索、解釋和評估模型;分析不同特征變量對響應(yīng)變量的影響
【8】根據(jù)腫瘤突變負荷TMB進行KM生存分析尋找最佳的cutoff
【9】基于單樣本富集分析算法評估組織中的免疫細胞浸潤水平
【10】代碼分享│什么?你還在用散點圖來可視化數(shù)據(jù)之間的相關(guān)性
【11】代碼分享│診斷列線圖、校準曲線、決策曲線和臨床影響曲線的構(gòu)建
【12】代碼分享│你了解基因的動態(tài)變化模式嗎
【13】代碼分享│生物信息分析之SCI熱門圖表-復(fù)雜熱圖
【14】代碼分享│生物信息分析之SCI熱門圖表-火山圖
【15】代碼分享│生物信息分析之SCI熱門圖表-箱型圖和小提琴圖
【16】代碼分享│深度學(xué)習(xí)-人工神經(jīng)網(wǎng)絡(luò)(ANN)的構(gòu)建
【17】代碼分享│R可視化:高分文章繪圖之基于RCircos包的多類型圈圖繪制
【18】代碼分享│R可視化:基因與功能之間的關(guān)系--GO功能富集網(wǎng)絡(luò)圖繪制
【19】代碼分享│生物信息分析之SCI熱門圖表—KM曲線和tROC曲線
【20】代碼分享│R可視化:腫瘤預(yù)后模型之Cox回歸分析后用R語言繪制森林圖
【21】代碼分享│生物信息分析之SCI熱門圖表—相關(guān)性熱圖和散點圖
【22】代碼分享│生信分析之R語言分析相關(guān)性及可視化的N種風格
【23】代碼分享│TCGA數(shù)據(jù)獲取有困難,不會預(yù)處理,學(xué)習(xí)起來
【24】代碼分享│機器學(xué)習(xí)-支持向量機遞歸特征消除(SVM-RFE)的構(gòu)建
【25】代碼分享│R可視化:對兩個矩陣進行相關(guān)性可視化分析
【26】GEO數(shù)據(jù)庫多數(shù)據(jù)集差異分析整合利器RRA,再也不用糾結(jié)去除批次效應(yīng)
【27】你與生信大佬的距離,只差2分鐘搞定預(yù)后模型構(gòu)建和性能評估
【28】9+SCI純生信,模型構(gòu)建中的“流量明星”,你不得不知的LASSO
【29】手把手教你畫美觀大氣的lasso回歸模型圖,為你的SCI增磚添瓦
【30】R可視化:clusterProfiler包做組間比較GO富集圖
【31】代碼分享|R可視化:復(fù)雜熱圖繪制技巧之熱圖中添加柱狀圖
【32】代碼分享——基于基因突變信息分析腫瘤突變負荷
【33】代碼分享│富集不到想要的通路?別放棄呀,試試GSEA
【34】代碼分享│還在用PCA做降維聚類嗎?最強降維模型tSNE--你值得擁有
【35】代碼分享│GSVA:原來功能通路也能做差異分析!
【36】代碼分享│Slingshot:你不知道的單細胞擬時序分析還有它
【37】基于基因功能注釋信息挖掘關(guān)鍵作用基因
【38】基于癌癥分類預(yù)測的標志物特征提取的SVM-RFE分析代碼
【39】依據(jù)表型數(shù)據(jù)基于無監(jiān)督聚類算法對研究群體進行分層聚類分析
【40】基于穩(wěn)健排序整合算法對多數(shù)據(jù)集進行整合及可視化
【41】基于基因表達譜估算樣本免疫基質(zhì)評分和腫瘤純度
【42】自動化繪制LASSO算法回歸模型圖
【43】用于臨床診斷和臨床決策影響的DCA分析
【44】基于樣本預(yù)后生存信息和臨床因素用于評價不同模型的一致性指數(shù)軟件
【45】用于探索、解釋和評估模型的DALEX殘差分析軟件
【46】基于細菌群落功能豐度結(jié)果進行差異功能分析及可視化
【47】基于基因差異分析結(jié)果繪制其在染色體上的分布
【48】利用逐步回歸法篩選特征基因構(gòu)建Cox風險模型分析
【49】基于Immune Subtype Classifier進行腫瘤免疫亞型分類
【50】不同物種之間的同源基因名稱轉(zhuǎn)換分析
【51】基于逐步多因素cox回歸篩選預(yù)后標記基因并構(gòu)建風險評分模型
【52】基于表達信息挖掘與關(guān)注基因密切相關(guān)的基因
【53】基因組學(xué)基因名稱修正分析
【54】基于Spearman算法構(gòu)建關(guān)聯(lián)網(wǎng)絡(luò)
【55】基于線性建模方法對代謝組和轉(zhuǎn)錄組數(shù)據(jù)整合分析
【56】基于lasso回歸模型方法篩選特征基因
【57】基于線性建模方法對代謝組和轉(zhuǎn)錄組數(shù)據(jù)整合分析
【58】基于參數(shù)型經(jīng)驗貝葉斯算法和支持向量機(SVM)篩選疾病亞型特征基因
【59】基于LDA(線性判別分析)算法的微生物biomarker的篩選
【60】基于R包xCell計算64種免疫細胞相對含量及下游可視化
【61】基于甲基化數(shù)據(jù)評估腫瘤純度及下游可視化
【62】基于DiffCorr包識別不同表型下的差異共表達關(guān)系對
【63】基于逆累計分布函數(shù)識別顯著偏差通路
【64】基于差異基因?qū)ν返挠绊懲诰蜿P(guān)鍵通路
【65】基于高通量數(shù)據(jù)的樣本相似性分析

需要以上代碼私信小果哦 !

生信果”,生信入門、R語言、生信圖解讀與繪制、軟件操作、代碼復(fù)現(xiàn)、生信硬核知識技能、服務(wù)器、生物信息學(xué)的教程,以及基于R的分析和可視化等原創(chuàng)內(nèi)容,一起見證小白和大佬的成長。

機器學(xué)習(xí)預(yù)測原發(fā)性前列腺癌的臨床結(jié)果,掌握這個思路,8分文章不在話下!的評論 (共 條)

分享到微博請遵守國家法律
迁安市| 台江县| 乐都县| 儋州市| 吴桥县| 罗源县| 澄城县| 杭锦后旗| 高淳县| 磐安县| 永安市| 桐城市| 舞阳县| 沁源县| 延寿县| 拜城县| 大洼县| 金山区| 山阳县| 临安市| 蚌埠市| 石柱| 醴陵市| 屏边| 绥江县| 棋牌| 梁山县| 大理市| 汪清县| 平邑县| 拉萨市| 云和县| 浙江省| 慈溪市| 阳城县| 永城市| 苍梧县| 桂平市| 攀枝花市| 聂拉木县| 叶城县|