一個(gè)反直覺的事實(shí):IBM的量子計(jì)算機(jī)最近做了一件傳統(tǒng)超算做不到的事——它訓(xùn)練出的AI模型,在沒增加參數(shù)、沒擴(kuò)充數(shù)據(jù)的情況下,回答出了基礎(chǔ)版本答不對的問題。
這件事的關(guān)鍵在于一個(gè)聽起來很技術(shù)、但理解起來很直觀的指標(biāo):困惑度(perplexity,簡稱PPL)。簡單說,PPL衡量的是AI預(yù)測下一個(gè)詞的"自信程度"。數(shù)值越低,AI越不容易胡言亂語;數(shù)值越高,輸出就越可能離譜。所有主流大模型——Claude、ChatGPT——都在和這個(gè)指標(biāo)較勁。
![]()
通常,降低PPL只有三條路:微調(diào)模型、喂更多數(shù)據(jù)、或者簡單粗暴地堆參數(shù)。GPT-5.5的參數(shù)量估計(jì)在2萬億到5萬億之間,而每個(gè)參數(shù)都要吃內(nèi)存。這條路走下去,基礎(chǔ)設(shè)施的壓力只會越來越大。
但Multiverse Computing的科學(xué)家換了個(gè)思路。他們在5月7日上傳到arXiv預(yù)印本數(shù)據(jù)庫的研究中提出:用量子電路塊——量子計(jì)算的基本單元——來運(yùn)行AI模型,哪怕只增加少量參數(shù),也能顯著壓低PPL。
具體來說,他們用IBM的超導(dǎo)量子硬件,對一個(gè)已經(jīng)部署在生產(chǎn)環(huán)境的大規(guī)模語言模型做了端到端的量子增強(qiáng)訓(xùn)練。結(jié)果是:這個(gè)模型回答出了基礎(chǔ)版本無法正確回答的問題。
研究人員在論文中明確表示,據(jù)他們所知,這是首次在真實(shí)超導(dǎo)量子硬件上,對生產(chǎn)級、廣泛部署的大語言模型實(shí)現(xiàn)端到端的量子增強(qiáng)。
這里需要劃個(gè)邊界:研究說的是"量子增強(qiáng)"(quantum enhancement),不是"量子霸權(quán)"或者"量子計(jì)算機(jī)全面超越經(jīng)典計(jì)算機(jī)"。增強(qiáng)的意思是,在特定環(huán)節(jié)、特定指標(biāo)上,量子介入帶來了可測量的提升。至于這種提升能擴(kuò)展到多大范圍、多大規(guī)模,研究本身沒有給出預(yù)測。
但這個(gè)"首次"依然值得注意。它意味著量子計(jì)算機(jī)不再只是實(shí)驗(yàn)室里的物理演示,而是開始介入AI訓(xùn)練的實(shí)際流程,并且產(chǎn)生了經(jīng)典方法難以復(fù)制的輸出質(zhì)量。
一個(gè)可以延伸想的問題:如果量子增強(qiáng)能在困惑度這個(gè)核心指標(biāo)上見效,它是否也能幫AI減少"幻覺"——那些看起來自信滿滿、實(shí)則編造內(nèi)容的輸出?研究沒有直接回答這個(gè),但困惑度和幻覺之間的關(guān)聯(lián),是行業(yè)里一直在討論的議題。
另一個(gè)懸念是成本。量子硬件目前的運(yùn)行條件極為苛刻,超導(dǎo)量子比特需要接近絕對零度的環(huán)境。用它們來訓(xùn)練AI,經(jīng)濟(jì)上是否劃算,研究沒有涉及。但科學(xué)家找到了一條不依賴無限堆參數(shù)、而是借用量子特性來提效的路徑,這本身打開了新的設(shè)計(jì)空間。
這件事的真正價(jià)值,可能不在于當(dāng)下的結(jié)果有多驚艷,而在于它證明了兩種技術(shù)棧——經(jīng)典AI和量子計(jì)算——可以對接,并且對接后產(chǎn)生了經(jīng)典單一路徑無法實(shí)現(xiàn)的性能。對于正在尋找AI效率突破口的行業(yè)來說,這是一個(gè)值得跟蹤的信號。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.