![]()
![]()
李昀 | 撰文
王晨 | 編輯
進入2026年,AI制藥的野火在行業內蔓延得更兇猛了。
3月中旬,羅氏宣布擴展其全球人工智能基礎設施,在美國和歐洲完成了2176個高性能GPU的部署;同月,禮來也正式啟用了其醫藥AI工廠LillyPod,并與英偉達宣布將在五年內投入超10億美元建立AI聯合創新實驗室。
兩家MNC合作的英偉達BioNeMo平臺采用的是實驗室閉環(Lab in the Loop)模式,其目的在于打造數字實驗室并探索定制化模型。和前幾年的AI工具外包以及碎片化運用不同,一旦這種模式能大規模應用,將演變成一種貫穿式系統,且與濕實驗之間形成可驗證的循環。
越來越多的AI龍頭也在努力擠進這一賽道。4月16日,OpenAI宣布推出GPT-Rosalind,這是一款用于藥物發現和轉化醫學的推理模型。首批客戶名單包括了安進、莫德納、艾倫研究所等。
和MNC的大舉進軍同步的是投資界的狂熱。
去年年末上市的英矽智能在掀起認購狂潮后勢頭不減,即使在創新藥股價整體疲軟的環境下,近日還在沖擊新高。投融資方面,華森制藥的海外AI制藥平臺Earendil Labs在3月末宣布完成了7.87億美元融資;AI醫療企業深度智耀在今年短短3個月里累計完成1.5億美元融資。無論從融資額還是融資速度上,有AI加持的醫藥企業都已超出了傳統創新藥企業一個身位。
但與此同時,在行業難以被外界探照到的角落,一些問題也開始涌現。
其中包括一些老生常談的問題,比如AI效率提升的環節在藥物研發流程中占比過小、作用不大,制藥行業的數據壁壘難以被打破,AI訓練的邏輯和生物科學的邏輯不對接,兩邊難以溝通;
同時,隨著投資驅動的AI制藥公司越來越多,魚龍混雜的問題也比兩年前嚴峻許多。在技術濾鏡逐漸破碎的今天,不少藥企尋找AI制藥合作伙伴的要求從“發現并驗證革命性靶點”降低成了“靠譜就行”。
一名曾在AI制藥公司工作過的人士稱,大部分處于融資階段的公司,拿出去展示的成功案例基本上都是“現有醫學證據已經支持的靶點”,本身就更容易做出有效藥物。“一些公司會拿一些研究機構的數據,對那些不懂行的投資人說AI制藥至少可以讓成功率提升兩倍。可能這個數據是真實的,但絕對是在選擇之后達到的結果。”
還有一名從業者提到,一些AI制藥公司的宣傳冊會列出大量候選分子,但大多“不是那么有挑戰性,也不太有吸引力”。而當她在相關會議上問AI制藥企業們可不可以做KRAS、多肽、跨膜蛋白GPCR等機制復雜的藥物,收到的往往是“我們回頭再研究一下”之類沒有信心的回復。
當資本在前面發出召喚,作為公司的本能就是向前沖鋒。但他們真的已經準備好了嗎?
AI模型的單一性
關于模型強弱和產出好壞的關系,業內一直存在爭議。一名在制藥行業工作但長期關注 AI 領域的人士認為, AI 參與藥物研發的主要作用在于減少無效實驗,也就是“避雷不踩坑”,但是其生成的數據質量和基于其上的預測并不比傳統模式優越太多。
上述從業者也舉例說明:她就職的藥企曾與一家 AI 制藥公司合作,但對方給出的腫瘤殺傷數據和 親和力數據, 與公司內部預測的并無二差,屬于“肉眼就可以判斷的程度”。 這個例子背后暗示的信息,在于:部分 AI 模型計算的方法和傳統模式下基于觀察和經驗的方法沒有本質區別。
“如果AI能做到的維度只能達到人類肉眼看到的維度,那就太局限了。”她說。
但上述曾在AI制藥公司工作過的人士認為,導致這一現象的根本原因還應歸咎于模型的單一性。“現在很多AI模型只能計算靜態結構下的分子狀態,但沒有納入細胞層面的動態變化等容易被忽略的因素。”他還提到,在預測結構親和力上,更準確的模型應該兼容物理方法,也就是根據分子動力學等科學邏輯來進行更接近“真實機制”的模擬和運算。
同濟大學生命科學與技術學院教授劉琦曾在一場行業論壇上拿新冠藥物Paxlovid舉例:對研發起主要作用的是基于常微分方程的PKPD數學模型分析,而非深度學習黑盒模型——這也從另一個角度證明了能提供生物學追溯路徑的模型在制藥過程中的重要性。
被成本困住
但想要把這種新的模型類型納入現有框架并非易事——等于對如今生成模型的方法,即“喂數據、訓練系統”的操作形成挑戰。同時,算法團隊里必須要加入更高比例的生物和藥化背景人才。
大部分初創公司基于成本考量,并不支持自身去做這種幅度的改進。除了研發新模型造成的巨額支出以外,還要考慮到:單一模型更具有規模和速度優勢,而多維度的模型系統不僅在算力上消耗更大,同時做出判斷和決策的時間更長。比如根據物理方法,模型往往需要數周才能模擬一次相互作用。
上述從業者提到,她所接觸的許多國內AI制藥公司,其模型都是依賴于Alphafold這一開源模型上。雖然不少大公司也在使用,但其自身的模型組合要比初創企業豐富很多。在上述論壇中,南佛羅里達大學教授許東也提到,以AlphaFold為代表的模型基于進化中的負選擇能很好地預測常見蛋白,但在面臨BCR/抗體等處于主動進化的邊緣案例時,效果要差的多。
“我們目前接觸的AI制藥公司,在預測蛋白折疊上大致準確。也就是你給他一個氨基酸序列,分析其怎樣折疊在一起的,形成什么厚度,這個是可以的,也幫科學家省去很多時間。但是兩個蛋白之間、尤其是抗體和抗原之間的互動,AI的預測并不是很準確。”
這也就意味著:國內企業因成本限制而大范圍使用的Alphafold,在面對不穩定、高自由度的系統時,經常會失效。上述AI制藥員工提到,他所了解的國內大多數企業,都是在Alphafold2和3的基礎上做優化,“真正做引擎開發或者使用付費產品的,不足十分之一”。
但免費的午餐即將結束。被業內譽為“Alphafold4”的IsoDDe已經登場,且根據《自然》雜志的報道,其抗體-抗原結合預測準確度是Alphafold3的2.3倍。主要原因在于該引擎能夠模擬CDR-H3環,這也是抗體結構中最具多樣性的部分。更重要的是,這款模型將不再開源。
如此,AI制藥公司將必須在成本與技術力之間做出選擇,預算的多少也將成為公司之間競爭的主要籌碼。當然,這也預示了在未來:就算技術力有缺陷,AI制藥企業也必須硬著頭皮將融資提上日程。
MNC的選擇:盲目還是理性?
盡管AI制藥在技術力上面臨著種種限制,依然沒有澆滅各大MNC投入的熱情。
除了開頭提到的羅氏和禮來,還有很多MNC在2026年在AI制藥上下注:1月,阿斯利康收購Modella AI,將其納入其生成式多模態生物大模型中;2月,武田制藥與Iambic Therapeutics 達成超17億美元 AI 抗癌新藥合作,這是日本藥企近十年最大AI制藥單筆投入。
而這些MNC之所以愿意花錢,原因在于其候選分子數量極其龐大,哪怕只是在臨床前某一環節上篩選效率總體提高10%,都會帶來幾十億級別的價值。
MNC對AI制藥的投入也能最大程度避免目前面臨的數據庫不足的問題。由于臨床試驗中負面結果很少被公司發表,因此在AI檢索語料庫中變缺乏這些關鍵數據供其學習。“只喂給AI成功案例,就會造成其預測成功率虛高的問題。”而在MNC主導的定制化模型中,有海量的失敗數據可供開放學習。
MNC可以堅定選擇AI制藥,還有一層更重要的原因:即有充分的資金進行模型組合。上述從業者提到,如今大部分初創企業都只有1-2個核心模型。“雖然有些公司宣傳自己從靶點發現到進入合成階段可以全覆蓋,但基本上要么是沒法做到,要么就是做得很粗糙。”這一問題,在MNC角度上不會存在。
有些AI制藥可能會基于環節選擇不同的開源模型:比如在結合預測上使用Alphafold,在虛擬篩選上使用Boltz-2。但這種拼合會造成系統的不一致,也不利于標準化工作。在跨模型工作中,由于下游模型對上游產出數據并不負責,因此經常會出現“將錯就錯”或者錯誤累積的情況。
正因為如此,大部分MNC才更傾向于一體化、定制化、有針對性的合作。目前被各大MNC追捧的“Lab in the Loop”理念也是對上述問題的一種解決:通過實驗數據的快速反饋來校正算法。在過去,訓練目標是提升局部模型組件的基準準確率;而未來,目標將更多圍繞著整體實驗成功率來設計。
可以說,在未來:如果AI制藥公司想進入真正的藥物開發核心流程,幾乎必須與MNC深度綁定。這不僅是因為MNC有足夠的經費可以投入,還在于當MNC完成了這一套系統閉環,僅僅作為某一環節的工具而存在的AI模型會遭到大面積淘汰。
換句話說,和MNC深度綁定,意味著完全融入這套一體化的循環系統中。這也就意味著:企業必須提升自己的定制化能力。同時,建立自動化的濕實驗快速測試也是打動MNC的關鍵技術點。
歡迎添加作者交流:
李昀:liyun940820
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.