腫瘤藥物發(fā)現(xiàn): 人工智能與基于結(jié)構(gòu)的計算研究【01】
近年來,科學界越來越多地使用人工智能(AI)和機器學習(ML)等計算方法,以及對接和分子動力學(MD)等基于結(jié)構(gòu)的方法,來加速發(fā)現(xiàn)潛在靶點,并優(yōu)先選擇治療各種疾?。ò[瘤藥物發(fā)現(xiàn))的小分子藥物。由于計算能力和實驗結(jié)構(gòu)闡明方面的進步,這些方法的整合已成為可能。這些努力促成了個性化抗癌療法的開發(fā),反映了腫瘤疾病的復雜性和多樣性。計算藥物發(fā)現(xiàn)領(lǐng)域正逐步轉(zhuǎn)向癌癥特異性應用,并證明了針對癌癥相關(guān)靶點的療法的有效性。

癌癥特征最初由 Hanahan 和 Weinberg 定義為六個特征,現(xiàn)在又增加了兩個新興特征和兩個有利特征。這些特征代表了腫瘤發(fā)生過程中共同的基本特征。了解這種復雜性對于開發(fā)個性化抗癌療法至關(guān)重要。人工智能(AI)與基于結(jié)構(gòu)的方法相結(jié)合,為癌癥藥物發(fā)現(xiàn)提供了一種更全面的方法,可解決癌癥的所有特征(方框圖中編號為 1 至 10)。此外,第十一個特征,即癌細胞逃避化療作用的能力。
本綜述的重點是將人工智能(AI)/機器學習(ML)和基于結(jié)構(gòu)(SB)的方法整合到專門應用于癌癥研究的計算藥物發(fā)現(xiàn)策略中。所評論的文章涵蓋了腫瘤學藥物發(fā)現(xiàn)管道的不同階段,討論了六個用例場景和四種整合方法。用例包括模擬誘變、(非)靶標預測、結(jié)合位點預測、虛擬篩選(VS)和異位調(diào)節(jié)分析。整合方法包括 (A) 使用結(jié)構(gòu)數(shù)據(jù)作為 ML 模型的輸入,(B) 基于 ML 的 SB 應用評分功能,(C) 用于分析分子動力學(MD)模擬的 ML,以及 (D) 將 SB 和 ML 方法互補結(jié)合的順序或并行管道。這些策略對生物學的影響體現(xiàn)在它們與十種已定義的癌癥特征的相關(guān)性,以及額外的第十一個特征:逃避化療的能力。這些方法和用例的異質(zhì)性凸顯了在腫瘤藥物發(fā)現(xiàn)中結(jié)合人工智能和 SB 的多種潛力。

圖 2展示了基于結(jié)構(gòu)(SB)和機器學習(ML)的集成方法在腫瘤藥物發(fā)現(xiàn)中的六種應用場景:1)驅(qū)動因素預測;2)模擬誘變;3)(非)靶點預測;4)結(jié)合位點預測;5)虛擬篩選;6)異構(gòu)調(diào)節(jié)分析。
計算癌癥研究中的驅(qū)動因素預測
在計算癌癥研究中,機器學習(ML)經(jīng)常被用于預測應優(yōu)先作為抗癌療法靶點的基因和突變驅(qū)動因素。這些方法,通常是泛癌癥的,而不是針對特定靶點或癌癥類型的。它們依賴于從癌癥患者身上獲得的多組學數(shù)據(jù)集,如體細胞突變、拷貝數(shù)變異、表觀遺傳學或從癌癥基因組圖譜(TCGA)等數(shù)據(jù)庫中獲得的 RNAseq 數(shù)據(jù)。
1.1 結(jié)合基于結(jié)構(gòu)的方法和多變量方法
Bailey 等人對驅(qū)動因素預測工具進行了廣泛的概述,并強調(diào)了結(jié)合不同工具以最大限度地提高預測性能的重要性。他們的方法將基于結(jié)構(gòu)的方法(SB)和 ML 方法并行整合在一起。其他研究,如 Knijnenburg 等人和 Li?ares-Blanco 等人的研究,使用在 omics 數(shù)據(jù)上訓練的分類模型(分別為邏輯回歸和隨機森林)來預測癌癥相關(guān)結(jié)果。他們利用特征重要性對基因進行優(yōu)先排序,以便進一步進行 SB 分析。Knijnenburg 等人進行了模擬誘變研究,并利用分子動力學(MD)模擬分析檢測到的可能影響蛋白質(zhì)穩(wěn)定性的變異。另一方面,Li?ares-Blanco 等人將 ML 衍生信息用于藥物再利用虛擬篩選(VS),將 FDA 批準的抗癌藥物與優(yōu)先蛋白質(zhì)的晶體進行結(jié)構(gòu)對接。
1.2 異質(zhì)性和挑戰(zhàn)
用于癌癥驅(qū)動因素預測的輸入數(shù)據(jù)、特征和結(jié)果變量并不統(tǒng)一。腫瘤微環(huán)境或轉(zhuǎn)移等重要方面往往被忽視。雖然TCGA數(shù)據(jù)因其高質(zhì)量和標準化而被廣泛使用,但其在2016年的凍結(jié)凸顯了更新癌癥患者數(shù)據(jù)庫(如基因組數(shù)據(jù)公共平臺)的必要性。
用于個性化抗癌療法的模擬誘變
通過預測特定點突變對蛋白質(zhì)功能和可藥性的影響,模擬誘變在開發(fā)個性化抗癌療法和臨床決策中發(fā)揮著至關(guān)重要的作用。體外誘變研究既昂貴又耗時,因此計算研究對于優(yōu)先選擇突變體進行實驗分析非常有價值。
2.1 使用結(jié)構(gòu)數(shù)據(jù)和 ML 分類器
大多數(shù)經(jīng)審查的模擬誘變方法都使用結(jié)構(gòu)數(shù)據(jù)來訓練 ML 分類器。這些數(shù)據(jù)直接來自晶體結(jié)構(gòu),或從分子動力學(MD)模擬中獲得。從野生型和突變型結(jié)構(gòu)中提取各種特征,并將其用于分類模型,以預測變異的臨床意義、蛋白質(zhì)穩(wěn)定性、蛋白質(zhì)相互作用穩(wěn)定性和配體結(jié)合動力學。
2.2 性能及與 SB 方法的比較
分類模型在誘變預測中的性能因用于訓練和驗證的實驗誘變數(shù)據(jù)的可用性而異。一些研究比較了 ML 模型與基于結(jié)構(gòu)(SB)方法在這些任務中的表現(xiàn)。在預測抑制劑親和力變化和確定激酶變體的激活狀態(tài)方面,ML 已顯示出良好的前景,與 SB 方法相比,其計算時間更短。
2.3 局限與機遇
模擬誘變方法的適用性通常僅限于數(shù)據(jù)充足的特定靶標或突變體。為了提高計算突變方法的影響力,可以使用具有高度保守的結(jié)合口袋和激活機制的蛋白質(zhì)家族其他成員的數(shù)據(jù)來豐富數(shù)據(jù)集。應遵循 FAIR 原則,建立具有實驗驗證的誘變數(shù)據(jù)的公共數(shù)據(jù)庫,以加強相關(guān)訓練和驗證數(shù)據(jù)集的開發(fā)。
總之,模擬誘變在推進個性化抗癌療法方面具有巨大潛力,但還需要進一步的實驗驗證和數(shù)據(jù)共享,以提高其準確性和適用性。
腫瘤藥物發(fā)現(xiàn)中的(非)靶點預測
預測藥物的(非)靶點空間對于獲得選擇性特征和設(shè)計具有多靶點特征的多藥理學候選藥物至關(guān)重要。機器學習(ML)和基于結(jié)構(gòu)(SB)的綜合方法已在預測(非)靶點空間、幫助合理藥物設(shè)計和再利用方面顯示出前景。
3.1 利用已知信息進行靶點預測
預測目標空間的工作通常從已知配體-蛋白質(zhì)或蛋白質(zhì)-蛋白質(zhì)相互作用開始。已有研究利用綜合 SB-ML 管道來確定天然化合物白藜蘆醇的潛在靶點。通過對接研究和三維定量活性-結(jié)構(gòu)關(guān)系(QSAR)模型,發(fā)現(xiàn) MDM2 和 QR2 是白藜蘆醇衍生物的潛在靶點。
3.2 合理的多藥理學方法
計算方法可用于提出新藥發(fā)現(xiàn)或藥物再利用的多藥理方法。已有一種綜合方法以一種已獲批準藥物的晶體結(jié)構(gòu)為模板,確定編碼具有適當配體結(jié)合空間的蛋白質(zhì)的基因。Docking 和 ML 算法預測了全基因組配體與蛋白質(zhì)的相互作用,提出 RIOK1 是 PDE3 抑制劑的非靶點,可用于潛在的抗癌藥物再利用。另一項研究利用順序 SB-ML 管道識別了與 DHODH 相關(guān)的新靶點,并篩選出抑制小細胞肺癌多個靶點的候選藥物。網(wǎng)絡(luò)藥理學分析確定了相關(guān)蛋白質(zhì),對接數(shù)據(jù)則確定了多靶點化合物的優(yōu)先順序,以便進行 MD 驗證。
3.3 影響和數(shù)據(jù)依賴性
綜合(非)靶點預測方法對腫瘤藥物發(fā)現(xiàn)中的先導物優(yōu)先排序具有直接影響。這些方法的適用性在很大程度上依賴于相關(guān)數(shù)據(jù)的可用性,如真正的結(jié)合模式或豐富的相互作用組數(shù)據(jù)庫以及已確定的靶點的生物活性數(shù)據(jù)。總之,在(非)靶點預測中整合 ML 和 SB 方法有望推動腫瘤藥物的發(fā)現(xiàn),提高藥物的選擇性和療效。參考資料:
González M G, Janssen A P A, IJzerman A P, et al. Oncological drug discovery: AI meets structure-based computational research[J]. Drug discovery today, 2022, 27(6): 1661-1670.
版權(quán)信息
本文系A(chǔ)IDD Pro接受的外部投稿,文中所述觀點僅代表作者本人觀點,不代表AIDD Pro平臺,如您發(fā)現(xiàn)發(fā)布內(nèi)容有任何版權(quán)侵擾或者其他信息錯誤解讀,請及時聯(lián)系A(chǔ)IDD Pro (請?zhí)砑游⑿盘杝ixiali_fox59)進行刪改處理。
原創(chuàng)內(nèi)容未經(jīng)授權(quán),禁止轉(zhuǎn)載至其他平臺。有問題可發(fā)郵件至sixiali@stonewise.cn