![]()
22年底ChatGPT橫空出世以來,從算力(GPU)、存力(存儲),指揮調度力(CPU)……AI已經帶動了一個又一個的半導體超級產業機會、一個又一個的萬億美金市值公司。
如果說在AI基建中,還有一個板塊尚待出現一個萬億市值“待爆帝”的話,海豚君接下來最為看好的就是AI時代的超級連接了。如果說算力解決了AI“智商”問題,存力解決了AI“記憶力”問題,那么運力要解決的就是如何將長、短期記憶“坐上火箭般的速度”高速出入腦力中心。
或者借用AI教皇黃仁勛的說法,隨著算力、內存瓶頸的逐步緩解,能源又是一個十年級的持續難度,下一個核心卡點是AI時代網絡的高速互聯,因為傳統云時代的網絡基建完全無法匹配Agentic AI時代下,數萬億模型參數、混合專家(MoE)、局部激活下,對網絡帶寬的傳輸需求。
本篇,就接著AI網絡傳輸速度下逐步切換的光電傳輸技術方向——CPO來探索一下AI時代的網絡傳輸。海豚君對于CPO的研究分為:
一、什么是CPO,它真的能替代傳統的銅連接嗎?
二、它是否又能完全替代當前主流的可插拔光模塊?
三、在此趨勢下,產業內上下游公司的競爭格局又將如何變化?
在本篇文章中,我們首先對產業鏈的基本問題做一個梳理。
以下是詳細分析
一、什么是CPO?
在傳統數據中心架構當中,有一個重要的部件即“光模塊”,它的作用是將光線傳輸過來的光信號轉化為電信號傳遞給數據中心,或者將數據中心內產生的電信號轉化為光信號并且傳遞給光纖,在數據傳輸中起到“橋梁”和“翻譯”的作用。
從作用上講,CPO(即共封裝光學)架構當中,包含了傳統光模塊的功能,但有以下兩個明顯差異:
1、結構不同
傳統的光模塊是可插拔的,表面看起來就像家里網線端口上的水晶頭,但CPO完全不同,它將負責光電轉換的光引擎,和芯片(這里主要是交換機的ASIC芯片)直接集成在同一封裝基板或者中介層上。
2、應用場景不同
光模塊通常應用于機柜間(即 Scale-out);而CPO既可以應用于機柜間,也可以應用于機柜內(Scale-up),應用于機柜間,替代的是傳統的光模塊,應用于機柜內,替代的則是目前主流的銅連接。
圖:傳統可插拔模式與CPO方案示意
![]()
資料來源:GTC 2025,Dolphin Research
我們可以看到,近期無論是英偉達,還是博通,都在積極推動他們CPO交換機方案。
那么CPO技術為什么會得到如此重視呢?因為數據中心對算力需求持續提升,數據中心對數據傳輸的帶寬需求也呈爆發式增長,且數據中心正在往超大規模算力集群的方向發展,那么在此過程中,舊有的傳統數據傳輸技術會形成諸多阻礙:
1、帶寬瓶頸
對于機柜間場景,由于傳統交換機面板空間有限,而傳統可插拔光模塊尺寸又難以縮小,導致單臺交換機能夠提供的端口受限,無法支持越來越高的帶寬要求。
目前可插拔模塊最高可支持1.6Tbps單模塊帶寬,單個交換機面板最多可支持51.2Tbps帶寬,未來有可能推出3.2Tbps模塊,交換機最高支持102.4Tbps,這幾乎已經達到可插拔光模塊的極限。
2、信號完整性瓶頸
在機柜內場景,隨著傳輸速率提升,如果使用傳統的銅纜,那么電信號在長距離傳輸時會面臨嚴重信號衰減和失真,并且傳輸距離也會越來越受限。
目前銅纜最高可支持1.8TB/s帶寬(如英偉達的NVLink銅纜),且距離被嚴格限制在2米以內,但單GPU對帶寬需求正在向3.6TB/s邁進。
3、散熱和功耗瓶頸
隨著傳輸速率提高,傳統通訊鏈路的功耗大幅上升,同時散熱也越來越面臨困難。我們知道目前美國數據中心建設面臨極大的能源障礙,所以功耗問題會帶來顯著的成本壓力。
CPO理論上可以較好地解決上述幾項問題,根據英偉達,應用CPO后功率效率可以提升3.5倍。
二、具體而言,數據中心的數據傳輸場景有哪些?
這里我們對數據中心在不同場景和不同環節中的數據傳輸技術路線進行拆分:
圖:Scale-out和Scale-up示例
![]()
資料來源:NADDOD,Dolphin Research
1、Scale-up,主要涉及機柜內互聯
主要涉及機柜內,尤其是服務器內的硬件互連,包括但不限于CPU、GPU、網卡、DDR內存以及硬盤之間的互連。
目前這部分連接主要以銅為主要連接介質,包括用來連接CPU、GPU以及網卡的PCle插槽以及內存插槽(PCB銅走線),SATA線等各類銅纜等。而CPO有可能顛覆目前的主流方案。
2、Scale-out,主要涉及機柜間互聯
主要涉及機柜或者服務器以及交換機之間的互連。
這部分連接就需要以光作為連接介質了,目前主要以光纖和可插拔光模塊為主要方案。同樣,CPO是重要發展趨勢,且比機柜內場景進展更快。
3、更進一步地,還有數據中心之間以及數據中心與外部的互連,這部分不是本文的討論重點。
![]()
從巨頭布局來看,CPO現階段在場景上主要面向機柜間,但未來可能面向機柜內場景。
三、CPO目前還處在初步的推廣階段,面臨的主要瓶頸是什么?
1、先進封裝技術的成熟
從底層技術來看,CPO與諸如可插拔光模塊這類傳統方案相比完全不同。傳統光電子零部件從生產技術上與廣義的光電子元器件及模組差異不大,但CPO需要將光引擎封裝到基板或中介層,主要依靠的卻是先進封裝技術如CoWoS。
與此同時,相對于我們通常所理解的先進封裝,CPO也有所不同,因為它不只要集成電子集成電路,同時還要集成光子集成電路,那么這種異質集成需要通過諸如臺積電COUPE技術進行混合鍵合。
問題在于,一方面,上述先進封裝技術工藝難度極大,無論是英偉達還是博通,都依賴臺積電產能,但產能是有限的,除此之外,包括所需的光耦和設備、混合鍵合設備、測試設備,以及ABF基板等材料的供應也可能存在障礙;
并且,現階段上述先進封裝技術,尤其是異質集成的生產良率還存在很大提升空間,導致成本遠高于可插拔方案。目前臺積電正努力提升先進封裝良率,但仍需要一定的時間。
2、檢修和維護問題
對于傳統可插拔方案而言,由于它們是“可插拔”的,所以檢修和維護很方便。但CPO完全不同,它的光電模塊與基板、中介層甚至芯片直接封裝在一起,那么檢修和維護難度會顯著大于傳統方案。
但以上問題也是可以解決的,比如從設計上提高一定的容錯率,或者在運營層面布局一定的冗余等等。
3、熱管理問題
光引擎與芯片進行高密度封裝,在運行時會導致局部升溫明顯,甚至超過激光器的耐受極限,所以熱管理也是一個大問題。為了解決以上問題,需要引入更高效的散熱方案,但這同樣會涉及成本。
4、標準化問題
目前英偉達、博通等為了搶占市場先機,積極推出自己完整的獨立的CPO交換機方案。但與此同時,行業標準(接口標準、封裝標準等)還暫未形成,如此一來,上下游難以基于統一標準進行研發、生產和配置,這也是商業化推廣的難點所在。
總之,可以看到,以上問題均存在解決方案,只不過要依靠技術的成熟、標準的制定等,但這都需要時間。
另一方面,從根本上講,CPO技術在綜合成本上需要形成優勢。
那么這就延伸出一個問題:無論何種方案,成本總是核心考量因素,但除CPO外,也有其他更先進,或者更保守的路線在推進當中,它們之間呈現怎樣的關系呢?這里我們先區分下不同技術路線的差異。
四、技術路線比較
1、CPO
我們討論的CPO,也就是共封裝光學(Co-Packaged Optics),如上文所述,指的是將光引擎和芯片封裝在同一基板上,這里的芯片既可以是交換芯片(Asic),也可以是GPU等計算芯片,但通常指的是交換芯片。
2、NPO
NPO是近封裝光學(Near-Packaged Optics),比CPO初級一點,還沒有打到封裝在同一基板甚至中介層這樣的尺度,而只是封裝在同一塊PCB母板上。
中國國內包括阿里、華為等都在推動NPO方案,這更多可看作是缺乏先進封裝產能下的一種妥協方案,但可能在一段時間內成為中國市場的主流方案,這一定程度上會影響到英偉達方案在中國市場的滲透。
圖:不同集成方式展示:(從上到下分別為可插拔方式、NPO、CPO(集成在封裝基板)、CPO(集成在中介層),以及下面要說的OIO)
![]()
資料來源:ASE,Dolphin Research
3、OIO
OIO(Optical I/O)可看作是CPO的進階,這里就沒有交換芯片的事情了,主要跟計算芯片相關,指的是將光引擎與計算芯片封裝在一起,甚至是直接在芯片層面上結合在一起,這面向的完全是機柜內場景。
圖:不同集成方式展示:可插拔、CPO、OIO
![]()
資料來源:臺積電,Openlight,Dolphin Research
談到這里,我們再來明確一下數據中心的架構:
數據中心,可以看作是以下幾個部分互相連接:
服務器專注于計算任務,內部裝載GPU、CPU等計算芯片,內存、硬盤等;
交換機則負責服務器之間以及服務器向外部的網絡通信,通過ASIC芯片實現數據交換;
除此之外還有存儲系統,在目前主流數據中心架構當中,存儲器主要分散布置在服務器節點,并放置于在服務器內部,與服務器結合在一起。
基于上述架構,我們就能可以想象CPO的應用場景。那么在此基礎上,我們討論下,為什么CPO率先從交換芯片開始?
這里我們對交換機的作用做個類比——交換機可以看作是數據中心內部的立交橋,那么可以想象,交換機所承擔的數據傳輸帶寬壓力、端口密度以及與之相伴隨的功耗瓶頸是最大的,那么自然對CPO的需求更迫切。
4、CPC
CPC,是共封裝銅互聯(Co-Packaged Copper),指的是把高速銅連接器直接集成在封裝基板上。
這種技術路線的成本優勢是非常明顯的,但仍然解決不了銅介質的帶寬瓶頸和衰減問題,所以應用場景比較受限,可以部分應用在機柜內部的GPU/CPU節點與交換機及存儲芯片之間的連接。目前英偉達機柜內方案仍采用銅連接,但未來可能將向光互連切換。
5、LPO
LPO,則是線性驅動可插拔光學(Linear-Drive Pluggable Optics),是一種瘦身版的可插拔光學,通過去除內部的DSP/CDR芯片,僅保留并強化模擬芯片Driver和TIA(這些部件的作用我們后面會講),實現信號直驅。
說白了,就是在光模塊中直接踢掉功耗大的DSP芯片,放棄信號糾錯;同時強化模擬芯片,無論信號準確與否,通過模擬放大,直接讓交換機ASIC的電信號來沖進來驅動激光器。
圖:傳統模式與LPO結構對比示意
![]()
![]()
資料來源:Bryon Moyer,Semiconductor Engineering,Dolphin Research
但這里同樣存在問題,由于PCB走線并沒有省略(會造成信號衰減),同時對信號質量要求又更高,于是長距離傳輸還是受限,并且當速率邁向更高維度(1.6T以上)時,信號完整性問題會格外凸顯。也就是說,簡化結構的同時,性能上也會有所犧牲。
![]()
綜上我們可以看到,盡管存在NPO、CPC、LPO等折中路線,但隨著數據中心邁向更高速率和更大集群,這些折中方案總歸會面臨瓶頸,CPO是未來必須要突破的下一代方案。
6、光電路交換機(OCS)又是什么,會威脅到CPO的地位嗎?
談到這里,無可回避地會涉及到OCS(Optical Circuit Switch)。OCS這種交換機的核心特點是全過程沒有光電交換,通過光開關矩陣,直接在光域內建立物理光路。
圖:OCS示意
![]()
資料來源:Orbray,Dolphin Research
可以直觀地想象,它就像是由一排排反射鏡(微鏡陣列)組成,可以根據指令調整反射鏡的角度,向不同的角度反射光線。
表面上看起來,OCS是直接轉發光信號,替代傳統交換機光-電和電-光轉換過程,似乎用這種技術路線,就不需要CPO了(至少不需要交換機環節的CPO)。但實際并不是這樣的。
這里我們梳理下,在數據中心當中,交換機的架構是如何構建的:
(1)主板內:首先我們知道數據中心內最核心的計算是通過GPU實現的,GPU計算完畢后,需要將數據傳遞給CPU,CPU經過處理后再傳遞給網卡(內含ASIC),或者也可以由GPU直接傳輸給網卡。
那么以上環節可以在一塊主板上實現,或者至少可以在一臺服務器內實現。
(2)機柜內:之后,數據就要從服務器傳遞到機柜的交換機上。一個機柜內可以有多臺服務器高速互聯,但機柜頂上必須有一個交換機,用來與外部通訊,將機柜內的數據與外部的數據做交換。這里這個交換機叫做ToR(Top of Rack)交換機。
而以上環節是在同一機柜內實現的。
(3)機柜間:數據中心是由多個機柜組成的集群,機柜和機柜間的通訊如何調度呢?這里就需要Spine交換機發揮作用了。Spine交換機負責管理所有Leaf交換機之間,以及向數據中心外部的高速連接,它是數據中心內整個交換機網絡的樞紐。
圖:在數據中心中,Spine交換機和Leaf交換機示意
![]()
資料來源:Bryon Moyer,Semiconductor Engineering,Dolphin Research
而OCS主要用來替代的是Spine交換機。
首先,Spine交換機價格高且功耗高,替代方案的需求最迫切。
其次,OCS作用是有限的,它只能轉發信號(反射光線),就像反光鏡。但傳統交換機功能更完整,它需要拆數據包,看IP地址,然后決定往哪里轉。所以說,由于OCS只能執行指令,沒有判斷能力,那么在這種情況下,它只被用來充當Spine交換機是可行的,但要是想把Leaf交換機也替代了,那就需要新增別的部件來執行“封包處理”功能,比如智能網卡(SmartNIC),那么這個架構就復雜了,它不一定是最好的方案。
這么看下來,架構就很清楚了:
雖然現階段,英偉達推出的Quantum X800-Q3450、博通等推出的Tomahawk 6 - Davisson等CPO路線的交換機,都是Spine交換機,而Google推動OCS交換機,替代的也是傳統Spine交換機,兩者之間的確存在直接競爭關系。
但終局來看,雖然OCS有機會替代Spine交換機,但再往下,對于用量更大的,Leaf交換機上光引擎與ASIC芯片之間的電光轉換,到服務器內主板與主板之間的連接(通過網卡ASIC或NVSwitch等),再到主板上計算芯片與計算芯片之間&計算芯片與網卡ASIC之間的連接,仍然需要使用CPO。所以未來兩者更多是相輔相成的關系。
五、涉及到的產業鏈環節有哪些?
(一)首先我們解析下CPO的原理和架構
CPO可看作是升級版的光引擎,而光引擎的作用是進行光電轉換,它主要包括以下幾個部分:
1、光子電路部分
(1)調制器:通過控制光的強弱和信號,把電信號(0/1數字)寫成光信號。
(2)探測器:是PD(Photodiode,光電二極管),把光信號轉換成電信號.
(3)波導:可以理解為芯片內部印上去的微型光纖。
2、電子電路部分
(1)Driver(驅動器):將交換機或者服務器傳來的微弱電信號放大成能精確控制激光器發光的電信號,所以Driver的下一個環節就是調制器。
(2)TIA(跨阻放大器):將PD產生的極其微弱的電信號,放大并轉換成可供后續電路處理的電壓信號,所以TIA是PD的下一個環節。
3、光源,也就是激光器
調制器自己是不能發光的,但它能控制光,所以這里就需要一個發光的部件與之配合,也就是激光器。
資料:光引擎結構示意
![]()
資料來源:宗澤國等,《400G FR4硅光收發模塊的研究》,Dolphin Research
另外還有兩個部件:
4、DSP和CDR,它們都是用來修復電信號的。一個用來補償電信號的物理損傷,一個用來從受損信號中提取精確時鐘,并重整數據時序,其中DSP芯片通常集成CDR功能。
CPO與LPO類似的一點是,它們都將高功耗、高成本,延遲源的DSP從光引擎中移除。但CPO方案下,DSP部分功能集成到了交換ASIC中,而LPO是用模擬芯片放大硬剛的方案),另外CPO會將CDR集成到高速SerDes。
而什么是高速SerDes呢?高速SerDes包括Ser串行器和Des解串器,它們位于Asic芯片內部,分別用來將芯片內部并行數據打包成高速串行數據流,或者將高速串行數據流解包還原成多路低速并行數據。
(二)再看整個CPO產業鏈涉及到哪些環節:
1、首先是CPO整體
CPO中的光引擎包含了上述提到的光子電路部分和電子電路部分,然后光引擎與ASIC芯片構成CPO交換機主體部分。這里先說一個核心問題誰來做這個CPO?
傳統的光模塊作為由光學組件、分立器件等組成的獨立模塊,可以由專業性生產廠商來完整提供,比如我們耳熟能詳的中際旭創、新易盛、Coherent,那么CPO呢?顯然不可能再由它們來主導了。
我們傾向于認為,CPO下的產業價值走向會是這樣的:
(1)掌握核心技術的交換廠商和平臺商:掌握英偉達/Google/博通/Marvell這樣的數據中心系統平臺方&交換芯片廠商來定義架構和標準+賣整套產品;
(2)代工廠:臺積電/日月光/Amkor這些Fab廠/封測廠來進行晶圓制造/光電集成/先進封裝代工;
(3)上游供應商:Coherent/Lumentum這些器件廠繼續進行光電器件的生產和供應。
(4)傳統光模塊廠商:中際旭創/新易盛等過渡期內提供NPO、LPO等中間路線,以及基于可維護性考量的折中CPO設計方案下,繼續提供光引擎模塊。
2、除了CPO的核心光引擎之外,還有幾個組件需要關注
(1)激光器
CPO只能夠集成光電轉換部件,直接集成激光器還存在難度,因此仍然需要外置激光器。與此同時,CPO對激光器的功率要求大幅增加(至少增加3-4倍),對應性能和可靠性要求也大幅提高,因此價值量也會大幅增加。
不過,這里存在技術路線的選擇:
1)EML激光器:傳統路線,它將激光器和調制器集成在一起,優勢是適合200G以上高帶寬和長距離通訊。這個路線被Lumentum、II-VI(Coherent)、住友等巨頭壟斷。
2)CW激光器:新興路線,它把激光器完全獨立,在成本和功耗上有優勢,也更匹配未來的CPO路線。CW激光器供應相對靈活,中國的源杰科技、仕佳光子、長光華芯等廠商已實現70mW/100mW產品量產并獲大額訂單。
圖:EML和CW激光器的區別示意
![]()
資料來源:住友電工,Dolphin Research
接著是四大光纖組件,這些組件在傳統可插拔光模塊路線下很少用到:
(2)光纖陣列單元(FAU,Fiber Array Unit):用來將光纖精確地安裝,以實現光纖與波導之間的高精度對準。
圖:Fiber Array Unit
![]()
資料來源:Corning,Dolphin Research
(3)保偏光纖(PMF,Polarization Maintaining Fiber):是一種特殊的光纖,用來使得光波的偏振態保持不變。
(4)光纖分配盒(Fiber Shuffle):用來排列光纖,可以將復雜的高密度設備里的光纖的位置順序重新排列。
圖:Fiber Shuffle示意
![]()
資料來源:Hyoptic,Dolphin Research
(5)光纖連接器(MPO,Multi-Fiber Push On):用于多芯光纖之間的相互連接。
圖:MPO端口示意
![]()
資料來源:Senko,US Conec,Dolphin Research
為什么傳統光模塊很少用到上述組件?
(1)傳統模式下,光纖直接插入標準化接口,但在CPO下,光纖需要與光芯片表面的波導進行高精度耦合,所以需要用到FAU;
(2)傳統模式是直接調制,對光波的偏振態不敏感,且此前保偏光纖(PMF)成本又極高,不太適合產業化應用,但CPO通過外部激光器供給光源,激光偏振態會導致巨大能量損耗,所以必須用到PMF;
(3)傳統模式通常只有1發1收兩路光纖,沒有那么復雜的光纖需要連接到背板,所以人工操作就可以,不需要Fiber Shuffle,但CPO下必須使用Fiber Shuffle;
(4)同樣,傳統模塊也不需要很多接口,但CPO下如果達到400G以上,需要8根甚至16跟光纖并行傳輸,而面板空間又有限,所以需要MPO這種多芯連接器。
那么對于市場空間,以及CPO所涉及到的產業環節投資機會,我們會在下篇中進行分析。
<此處結束>
//轉載開白
本文為海豚研究原創文章,如需轉載請添加微信:dolphinR124 獲得開白授權。
//免責聲明及一般披露提示
本報告僅作一般綜合數據之用,旨在海豚研究及其關聯機構之用戶作一般閱覽及數據參考,並未考慮接獲本報告之任何人士之特定投資目標、投資產品偏好、風險承受能力、財務狀況及特別需求投資者若基於此報告做出投資前,必須諮詢獨立專業顧問的意見。任何因使用或參考本報告提及內容或信息做出投資決策的人士,需自行承擔風險。海豚研究毋須承擔因使用本報告所載數據而可能直接或間接引致之任何責任或損失。本報告所載信息及數據基於已公開的資料,僅作參考用途,海豚研究力求但不保證相關信息及數據的可靠性、準確性和完整性。
本報告中所提及之信息或所表達之觀點,在任何司法管轄權下的地方均不可被作為或被視作證券出售邀約或證券買賣之邀請,也不構成對有關證券或相關金融工具的建議、詢價及推薦等。本報告所載資訊、工具及資料並非用作或擬作分派予在分派、刊發、提供或使用有關資訊、工具及資料抵觸適用法例或規例之司法權區或導致海豚研究及/或其附屬公司或聯屬公司須遵守該司法權區之任何註冊或申領牌照規定的有關司法權區的公民或居民。
本報告僅反映相關創作人員個人的觀點、見解及分析方法,並不代表海豚研究及/或其關聯機構的立場。
本報告由海豚研究製作,版權僅為海豚研究所有。任何機構或個人未經海豚研究事先書面同意的情況下,均不得(i)以任何方式製作、拷貝、複製、翻版、轉發等任何形式的複印件或複製品,及/或(ii)直接或間接再次分發或轉交予其他非授權人士,海豚研究將保留一切相關權利。
![]()
文章不易,點個“分享”,給我充點兒電吧~
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.