![]()
子宮內膜癌( EC )是全球最常見的婦科惡性腫瘤之一,發病率隨著社會經濟發展和人口老齡化持續上升。 然而目前仍缺乏高效的子宮內膜癌微無創篩查方案,經超聲和臨床表現評估可疑內膜病變的患者經有創的子宮內膜 活檢 僅有不足 10% 確診內膜癌,損傷大,費用高,確診效率低。成為早期診斷內膜癌的瓶頸。另一方面, 現行 子宮內膜癌 分子分型依賴基因測序,流程耗時, 嚴 重滯后精準治療的實施。因此,開發兼具 高 靈敏 度 與臨床可及的子宮內膜癌篩查與分型新策略,是該領域亟待解決的重大挑戰。
近年來,多組學整合分析與人工智能( AI )技術的飛速發展,為 子宮內膜癌 的精準診斷帶來了新機遇。體液中的代謝組、蛋白質組等分子信息能夠動態反映腫瘤相關的生理病理改變,而機器學習則為多維異質數據的高效融合與疾病風險預測提供了強大的計算框架。基質輔助激光解吸電離飛行時間質譜( MALDI-TOF MS )憑借其高通量、操作簡便、樣本需求量少等優勢,已在臨床 診斷和分析中 廣泛應用,并展現出向腫瘤診斷延伸的重要潛力。
近日,復旦大學 化學系喬亮團隊 與 上海市第十人民醫院陳曉軍團隊 合作,在Cell Reports Medicine上發表了題為Artificial intelligence-driven integration of multi-biofluid omics and clinical phenotype enables stratification of endometrial cancer的研究論文。該研究開發了基于多體液多組學與臨床表型整合的子宮內膜癌分層平臺(2M-EC),通過多維分子醫學數據的AI決策模型實現了從高效微創篩查、輔助診斷到高危亞型快速檢測的全流程決策支持,為子宮內膜癌的精準診療提供了重要新策略。
![]()
臨床隊列 研究設計與數據采集
研究團隊納入來自兩個獨立臨床中心的共 735 名受試者,其中復旦大學附屬婦產科醫院 531 例用于 模型開發,同濟大學附屬第十人民醫院 204 例用于 外部驗證。研究共采集 1,179 份樣本,涵蓋血漿、宮頸分泌物及宮腔分泌物三類體液,并同步收集年齡、絕經狀態、激素替代治療史、婦科超聲、 HE4 及 CA125 等臨床信 息。所有體液樣本均經 MALDI-TOF MS 進行多組學 質 譜分析,一小時內即可完成從樣本預處理到臨床決策的全流程(約 45 分鐘樣本前處理、約 10 分鐘質譜分析、約 2 分鐘模型預測),充分體現了該技術路線的臨床適用性。
機器學習 解析體液分子特征,篩選關鍵臨床因素
研究團隊首先通過多變量分析,從臨床數據中系統甄別出與 EC 風險最相關的核心指標,包括年齡、 HE4 水平、絕經狀態、激素替代治療史及多項超聲特征(子宮內膜異質性、內膜厚度、宮腔液、宮腔占位性病變等)。聚類熱圖顯示, HE4 在區分 EC 與對照組中發揮顯著作用,而 CA125 的鑒別效能相對有限,尤其在絕經前女性中差異更為突出。
在分析物 - 算法組合選優方面,研究團隊系統評估了 17 種機器學習算法與多種體液分析物的組合性能,并引入等寬區間分箱( binning )方法對 MALDI-TOF MS 譜圖進行高效處理,有效規避了傳統峰對齊計算的繁瑣流程。篩選結果顯示,以決策樹為基礎的集成算法( XGBoost 、隨機森林、 LightGBM 、 CatBoost )在各類性能指標上均優于其他算法,為后續模型構建提供了堅實基礎。
集成多元 AI 融合 模型,實現 多層次風險 分層
基于上述最優分析物 - 算法組合,研究團隊構建了三層次任務驅動模型體系:
第一層 高效 微創 篩查( EC-Screen ): 利用血漿與宮頸分泌物多組學特征聯合臨床信息,研究團隊分別建立宮頸融合模型和血漿融合模型,并采用 "OR" 邏輯將兩者整合為 EC-Screen 篩查模型。在內部測試隊列( 95 例)中,該模型靈敏度高達 98.15% ,準確率 82.11% ,顯著優于 ROMA 算法。在外部驗證隊列中,該模型同樣維持 95.65% 的高靈敏度,表明其 有望用于 EC 篩查 ,有效彌補現行超聲篩查效能不足的臨床空白。
第二層 輔助診 斷( EC-Diagnosis ): 在篩查模型基礎上,研究團隊進一步引入宮腔分泌物代謝組學特征,通過多數投票策略整合三類體液融合模型,構建 EC-Diagnosis 診斷模型。該模型在外部驗證隊列中實現 AUC=0.94 、靈敏度 91.30% 、特異度 83.08% 的均衡性能,有效降低假陽性率,可 用于臨床決策支持。
第三層 高危 分型 快速檢測 ( EC-Subtyping ): 針對子宮內膜癌 對治療不敏感 的兩種分子亞型 ( p53abn 與 NSMP ) ,研究團隊利用 發生在癌癥原位的 宮 腔分泌物代謝組學特征分別構建分型分類器。交叉驗證結果顯示, p53abn 檢測模型準確率 77. 7 8% , NSMP 檢測模型準確率 91. 6 7% ,初步證實了通過微創液體活檢實現分子亞型快速預測的可行性,有望在 正式分型 結果獲得之前為臨床治療決策提供先行參考。
蛋白質與代謝組學手段聯合 解析 重要 分 子 標志物 與癌癥通路
研究團隊進一步通過 LC-MS/MS 對 MALDI-TOF MS 識別的關鍵特征進行分子鑒定,揭示了這些組學標志物的生物學意義。在血漿蛋白質組學分析中,共鑒定出 14 種 與 EC 相關的蛋白質,包括纖維蛋白原 α 鏈( FGA )、血清淀粉樣蛋白 P 組分( APCS )、視黃酸受體反應蛋白 2 ( RARRES2 )及泛素結合酶 E2 V2 ( UBE2V2 )等,與已報道的 EC 發病相關通路具有良好一致性。宮頸代謝組富集通路集中于脂肪酸氧化代謝,血漿代謝組則以氨基酸代謝為主,二者共同反映了 EC 特有的代謝特征。宮腔代謝組的通路分析則揭示了激素代謝(雄激素 / 雌激素、類固醇激素合成)、 PI3K/AKT 相關脂質代謝及糖代謝通路的顯著改變,與 EC 激素驅動的發病機制吻合。針對 p53abn 亞型的代謝特征分析,進一步揭示了細胞周期調控、 DNA 損傷修復及一碳代謝通路的異常激活,為理解該侵襲性亞型的代謝基礎提供了新線索。
內膜癌 全程精準分層 管理 平臺 的 臨床轉化
為推動上述研究成果的臨床 轉化 ,研究團隊基于 Streamlit 框架開發了 2M-EC 網絡工具( https://2e-mc-web.streamlit.app/ ),集成 EC 高效 篩查 和輔助 診斷功能模塊。用戶可通過輸入多類體液的 MALDI-TOF MS 分子特征及臨床信息,獲取 EC 風險預測結果,并通過交互式可視化界面直觀呈現各特征的決策貢獻度。
本研究的重要價值在于:系統整合多體液多維度 分子 組學數據與臨床表型,建立起子宮內膜癌全程精準分層體系;證實 MALDI-TOF MS 作為高通量、低成本臨床質譜 篩查 平臺的可行性,并通過兩中心獨立隊列的前瞻性驗證,為該平臺的跨機構推廣提供了有力證據。該平臺尤其適合 發病率高地區 的大規模篩查與個性化醫療場景,展現了 人工智能融合 分子 多組學 數據 與 醫學信息 在精準腫瘤 診療 中的巨大潛力。
![]()
復旦大學 化學系 李丹丹博士和 復旦大學 附屬婦產科醫院 吳鵬飛博士為論文的共同第一作者。 上海市第十人民醫院 陳曉軍教授和 復旦大學化學系 喬亮教授為共同通訊作者。
原文鏈接:https://doi.org/10.1016/j.xcrm.2026.102805
制版人:十一
BioArt
Med
Plants
人才招聘
學術合作組織
(*排名不分先后)
![]()
轉載須知
【非原創文章】本文著作權歸文章作者所有,歡迎個人轉發分享,未經作者的允許禁止轉載,作者擁有所有法定權利,違者必究。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.