他帶人干了件最狂的事,花五個月把底層代碼全遷到了華為昇騰上,徹底不要英偉達的CUDA了。
難怪黃仁勛在采訪里急得直跳腳,連“芯片又不是濃縮鈾”這種話都喊出來了。這哪是賣不賣芯片的事,這是咱們自己把路給鋪好了,以后不看他們臉色了。
這事兒得從2026年4月底說起。當時DeepSeek V4正式發布,外界都盯著它那百萬級的上下文窗口看,可圈內人一眼就瞅見了真正的核彈——發布公告里輕描淡寫的那句“全面適配華為昇騰950PR芯片”。
翻譯過來就是,中國最頂尖的AI大模型,從今往后訓練和推理,再也不需要英偉達的顯卡了。
你可能會說,不就是換個芯片嗎,有啥大驚小怪的?
這可不是給電腦換個顯卡那么簡單。這好比給一架正在萬米高空飛行的波音客機,把整個發動機系統從美國普惠的,換成咱們國產的太行,還得保證飛機不顛簸、不掉高度、穩穩當當地繼續飛。
大模型的底層代碼,那動輒上百萬行,里邊的算子、內存管理、集群通信,每一個螺絲釘都跟英偉達的CUDA生態焊得死死的。
過去十幾年,全球AI開發者都活在這個生態里,就像魚離不開水。
梁文鋒帶著他平均年齡不到30歲的139人團隊,硬是用了五個月,一行一行地把代碼從美國標準“翻譯”成了中國標準。
最難的還不是重寫代碼,而是“精度對齊”。簡單說,就是必須保證同一個模型,在英偉達GPU上跑出來是什么結果,在華為昇騰芯片上跑出來就得一模一樣,分毫不差。
這活兒精細得像在芯片上繡花,差一點,模型就“學歪了”。
為了啃下這塊硬骨頭,DeepSeek連V4模型的發布都推遲了,就為了確保國產化遷移萬無一失。
結果呢?性能不降反升!遷移到昇騰平臺后,DeepSeek V4的推理速度最高提升了35倍,訓練和推理的綜合算力成本直接下降了40%。
以前因為硬件限制沒法跑的高級算法,現在全解封了。
這哪是簡單地換個零件,這簡直是給賽車換了個量身定制的、動力更強的引擎。
這下你明白黃仁勛為啥著急了吧。他那句“芯片又不是濃縮鈾”,是在一次播客采訪里被主持人逼問時脫口而出的。
當時主持人質問他向中國出售高端芯片是不是等于“賣濃縮鈾資敵”,把這位芯片巨頭氣得連說“荒謬”、“幼稚”。
老黃的憋屈我們懂,英偉達被美國的出口管制政策卡得死死的,特供中國的“閹割版”芯片性能打折不說,研發成本還漲了30%,結果在中國市場的份額從巔峰時的95%暴跌。
他當然想賣,但更讓他心驚肉跳的是,像DeepSeek這樣的中國頂級玩家,竟然真的能拋開他的CUDA,另起爐灶了。
梁文鋒這一“掀桌”,掀掉的不僅是英偉達的技術依賴,更是中國AI頭頂上那把“卡脖子”的達摩克利斯之劍。
長期以來,國內AI公司每年都得花天價從英偉達買芯片,還得被動接受各種技術限制和條款,發展的命脈攥在別人手里。
現在DeepSeek用行動證明,離開CUDA,咱們不僅能活,還能活得更好。
更狠的是,DeepSeek宣布把遷移過程中積累的所有技術文檔和培訓體系全部開源。
這意味著什么?意味著國內幾十萬AI開發者可以近乎無成本地獲取在昇騰平臺上開發的經驗。
以前那座高不可攀的生態壁壘,現在被炸開了一個大口子。
一個從芯片(昇騰)、框架(CANN)到模型(DeepSeek)的完整國產AI技術鏈條,第一次在高端領域形成了閉環。
所以,這根本不是一次簡單的技術切換,這是一場從根子上開始的“獨立宣言”。
它向世界宣告,中國AI的算力底座,正在從“依賴進口”全面轉向“自主可控”。
當美國想用芯片當“濃縮鈾”一樣來封鎖我們時,我們的回應是埋頭苦干,自己造出一條更寬敞、更自主的新路。
黃仁勛的焦慮,恰恰印證了我們這條路走對了。他擔心的不是少賣幾塊芯片,而是CUDA那個看似固若金湯的生態帝國,出現了第一道深刻的裂痕。
這道裂痕,是一個名叫梁文鋒的中國工程師,帶著一群年輕人,用五個月時間,一錘一錘鑿出來的。
從此,太平洋兩岸的AI競賽,有了另一套完全不同的游戲規則。
而我們,終于拿到了制定規則的一部分權力。這場無聲的戰役,勝負已現端倪。
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.