![]()
全基因組關聯研究( GWAS )已經發現了數千個與復雜疾病相關的遺傳位點,但絕大多數位于非編碼區域,其功能機制仍難以解釋。近年來,基于人工智能( AI )的深度學習模型,如 Enformer ,能夠通過 DNA 序列預測基因調控活性,為 解析非 編碼遺傳變異功能提供了新的方向。然而,這類基礎模型通常基于廣泛的通用數據進行訓練,缺乏疾病和組織特異性的調控背景,因此在癌癥等復雜疾病中的應用仍存在局限性。
近日, Vanderbilt University Medical Center 的Qing Li所在的XingyiGuo教授 團隊,與 University of Calgary 的QuanLong教授團隊共同開發了一種基于遷移學習( transfer learning )的人工智能( AI )框架,并在PLOS Genetics發表研究成果 ,題目為Tissue-specific transfer learning improves functional variant and therapeutic target discoveries in breast and prostate cancer。該框架用于構建乳腺癌和前列腺癌組織特異性的基因調控模型,通過將預訓練的Enformer模型進一步適配于癌癥相關組織環境,顯著提升了癌癥風險基因及功能性遺傳變異的識別能力。
![]()
該研究首先收集了大量組織特異性的轉錄因子 ChIP-seq 數據集,包括 275 個乳腺組織數據集和 357 個前列腺組織數據集,并基于這些數據對 Enformer 模型進行遷移學習訓練。研究人員隨后利用新模型,對數百萬個 GWAS 遺傳變異進行了組織特異性順式調控活性( cis-regulatory activity )評分,識別出最可能影響癌癥風險的關鍵調控變異。
進一步分析發現,經過遷移學習優化后的模型,在富集癌癥相關增強子、 ClinVar 致病變異以及 GWAS 風險位點方面均明顯優于原始 Enformer 模型。隨后,研究團隊 結合全轉錄組關聯 分析( TWAS ),系統鑒定了多個與乳腺癌和前列腺癌相關的候選風險基因。這些基因不僅在癌細胞生長中具有重要功能,還富集于已知癌癥相關通路,并具有潛在藥物靶點價值。
研究結果表明,遷移學習模型在識別具有臨床相關性的疾病基因方面顯著優于基礎模型。其中,多數優先識別的基因同時獲得了功能基因組學( DepMap )、疾病數據庫( DisGeNET )以及藥物數據庫等多維度證據支持,說明該方法能夠更加精準地解析癌癥相關遺傳調控機制。
該研究展示了如何通過 “ 疾病特異性數據 ” 對現有 AI 基礎模型進行再訓練,從而顯著提升復雜疾病中功能基因和遺傳變異的發現能力。該框架不僅適用于乳腺癌和前列腺癌,也為其他復雜疾病的 AI 調控建模提供了可推廣的新思路。
原文鏈接:https://doi.org/10.1371/journal.pgen.1012145
制版人:十一
BioArt
Med
Plants
人才招聘
學術合作組織
(*排名不分先后)
![]()
轉載須知
【非原創文章】本文著作權歸文章作者所有,歡迎個人轉發分享,未經作者的允許禁止轉載,作者擁有所有法定權利,違者必究。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.