![]()
這是"關(guān)鍵瓶頸"系列的最新一篇,該系列持續(xù)關(guān)注AI基礎(chǔ)設(shè)施擴(kuò)張所面臨的核心挑戰(zhàn)。
弗吉尼亞州一個(gè)擬建數(shù)據(jù)中心園區(qū)在初期部署階段申請的用水量高達(dá)每日200萬加侖(MGD),未來需求峰值甚至可能達(dá)到每日800萬加侖。相關(guān)公用事業(yè)服務(wù)協(xié)議明確指出,該項(xiàng)目的預(yù)期需求已超出現(xiàn)有供水與污水處理規(guī)劃的承受范圍。文件深處還藏著另一項(xiàng)要求:"為保護(hù)關(guān)鍵運(yùn)營所需的敏感設(shè)備,須持續(xù)進(jìn)行蒸發(fā)冷卻。"
過去兩年,AI基礎(chǔ)設(shè)施的競爭焦點(diǎn)始終集中在電力系統(tǒng)上。公用事業(yè)公司不得不重寫負(fù)荷預(yù)測,電網(wǎng)運(yùn)營商在海量并網(wǎng)申請的壓力下疲于應(yīng)對,超大規(guī)模云服務(wù)商爭相鎖定變電站、天然氣容量和輸電通道,以支撐日益耗電的AI集群。如今,同樣的壓力正向另一個(gè)本為緩慢穩(wěn)定增長而設(shè)計(jì)的系統(tǒng)蔓延——市政供水基礎(chǔ)設(shè)施。
在多個(gè)地區(qū),水資源正逐漸成為類似電網(wǎng)容量的選址限制因素,直接決定大型AI園區(qū)能否落地或擴(kuò)建。隨著開發(fā)商向搭載密集GPU部署的超大園區(qū)邁進(jìn),公用事業(yè)公司和市政當(dāng)局開始直面冷卻架構(gòu)、再生水獲取、污水處理容量以及長期干旱規(guī)劃等一系列問題。喬治亞州牛頓縣的一位水務(wù)局代表在面對某數(shù)據(jù)中心項(xiàng)目提出的每日600萬加侖用水申請時(shí),直截了當(dāng)?shù)卣f:"我們根本沒有這么多水。"這句話折射出一個(gè)更宏觀的現(xiàn)實(shí):拿到電力供應(yīng),并不等于同時(shí)擁有足夠的冷卻用水、污水處理能力或市政支持。
在德克薩斯州,2027年州級供水規(guī)劃草案預(yù)測,即便人口增長超過50%,全州現(xiàn)有供水量到2080年仍可能下降約10%。州政府估計(jì),未來50年可能需要約1740億美元的供水基礎(chǔ)設(shè)施投入,以滿足日益增長的AI需求并維持穩(wěn)定供水。該規(guī)劃以歷史最嚴(yán)重干旱為情景基準(zhǔn)進(jìn)行編制,而這恰恰是大型AI集群冷卻用水壓力最為集中的時(shí)段,但規(guī)劃并未將AI相關(guān)數(shù)據(jù)中心的需求單獨(dú)列為一個(gè)規(guī)劃類別。
AI熱潮背后的物理本質(zhì)
供水系統(tǒng)從未為密集運(yùn)行、熱負(fù)荷極高的AI集群而設(shè)計(jì)。業(yè)界對算力侃侃而談,但背后的物理規(guī)律始終圍繞著熱量排放展開。
加州大學(xué)河濱分校的研究人員在一篇研究AI用水足跡的論文中寫道:"服務(wù)器消耗的能量幾乎全部轉(zhuǎn)化為熱量,必須從數(shù)據(jù)中心機(jī)房中排出,才能避免過熱。"
多年來,大多數(shù)數(shù)據(jù)中心主要依賴風(fēng)冷散熱。AI的出現(xiàn)徹底改變了這一格局。現(xiàn)代GPU系統(tǒng)每個(gè)機(jī)架所產(chǎn)生的熱密度遠(yuǎn)超傳統(tǒng)企業(yè)級硬件。運(yùn)營商越來越多地部署芯片直接液冷(D2C)、背門熱交換器、冷凍水回路和大型冷卻分配系統(tǒng),以實(shí)現(xiàn)高效散熱。水泵、冷卻塔、處理系統(tǒng)、冷水機(jī)組、再生水系統(tǒng)和市政供水基礎(chǔ)設(shè)施,如今都直接嵌入散熱鏈路之中。
能源與用水的權(quán)衡取舍
冷卻方案的選擇迫使運(yùn)營商在電力需求與耗水量之間尋求平衡。蒸發(fā)式系統(tǒng)可降低電力需求,但會(huì)增加直接用水量。干式或絕熱冷卻可減少用水依賴,但在極端高溫天氣下可能推高能耗。
德克薩斯大學(xué)奧斯汀分校專注于熱力系統(tǒng)、液冷及AI基礎(chǔ)設(shè)施用水研究的副教授Vaibhav Bahadur告訴《數(shù)據(jù)中心知識(shí)》:"從用水角度看,冷卻塔是最差的方案;干式或絕熱冷卻是最優(yōu)的。但這還必須結(jié)合能耗一并考量。"
加州大學(xué)河濱分校副教授、前述AI用水足跡論文共同作者Shaolei Ren在近期公開評論中指出,蒸發(fā)輔助冷卻在極端夏季條件下可將峰值冷卻功耗降低20%至60%,實(shí)際上是將部分基礎(chǔ)設(shè)施壓力從電網(wǎng)轉(zhuǎn)移到了市政供水系統(tǒng)。他還警告說,數(shù)據(jù)中心存在"兩種截然不同的用水依賴":一是直接冷卻需求,二是與發(fā)電相關(guān)的大量場外用水負(fù)擔(dān)。
AI高密度部署改變冷卻方程
勞倫斯伯克利國家實(shí)驗(yàn)室研究人員于2025年發(fā)布的一篇綜述論文發(fā)現(xiàn),根據(jù)冷卻架構(gòu)、電網(wǎng)用水強(qiáng)度、服務(wù)器利用率、氣候帶和能效水平的不同,工作負(fù)載層面的用水量差異可超過10000倍。
UC河濱的論文指出,D2C液冷系統(tǒng)本身"不會(huì)蒸發(fā)或消耗水"。目前業(yè)界普遍強(qiáng)調(diào)封閉式液冷系統(tǒng)——冷卻液在密封管路和冷板中循環(huán)流動(dòng),而非在服務(wù)器環(huán)境中蒸發(fā)。但封閉式系統(tǒng)并不能消除更宏觀的冷卻負(fù)擔(dān),設(shè)施仍須將熱量排放至外部環(huán)境。
EkkoSense首席營銷官Justin Bluming在接受《數(shù)據(jù)中心知識(shí)》采訪時(shí)表示:"將熱量從數(shù)據(jù)大廳導(dǎo)出,不過是把它集中并轉(zhuǎn)移到別處。液冷改變的是熱量的傳輸方式,但設(shè)施最終仍須將其排放到外部環(huán)境。"
他補(bǔ)充說,隨著機(jī)架密度持續(xù)攀升、GPU集群愈加趨近滿負(fù)荷持續(xù)運(yùn)行,監(jiān)控的精細(xì)程度愈發(fā)重要。"AI機(jī)架的問題往往在接近最高負(fù)載時(shí)運(yùn)行,其影響范圍可能更大。"
間接與直接用水
UC河濱的論文指出,芯片直接液冷系統(tǒng)本身"不會(huì)蒸發(fā)或消耗水"。
然而,大型AI集群仍需設(shè)施級熱量排放,根據(jù)設(shè)施設(shè)計(jì)和電力來源的不同,這可能通過冷卻塔、蒸發(fā)輔助系統(tǒng)或發(fā)電過程將用水需求轉(zhuǎn)移至其他環(huán)節(jié)。
隨著開發(fā)商轉(zhuǎn)向自建天然氣發(fā)電,以繞過電網(wǎng)并網(wǎng)瓶頸,這一區(qū)分將變得更加重要。場地自發(fā)電系統(tǒng)雖然可以減少對緊張輸電基礎(chǔ)設(shè)施的依賴,但根據(jù)發(fā)電技術(shù)和冷卻設(shè)計(jì)的不同,也可能增加區(qū)域整體用水量。
Bahadur表示:"隨著更優(yōu)技術(shù)的采用和優(yōu)化,直接用水量將有所下降,但間接用水可能成為一個(gè)重大問題。"
性能與熱裕量
盡管用水問題日益受到關(guān)注,運(yùn)營商仍持續(xù)推進(jìn)液冷部署,因?yàn)槊芗腁I工作負(fù)載已越來越難以靠傳統(tǒng)風(fēng)冷系統(tǒng)應(yīng)對。
一項(xiàng)近期對液冷與風(fēng)冷8×英偉達(dá)H100系統(tǒng)的基準(zhǔn)測試研究發(fā)現(xiàn),液冷配置在峰值負(fù)載下將GPU溫度維持在41至50攝氏度,而風(fēng)冷系統(tǒng)則高達(dá)54至72攝氏度。更低的溫度使液冷系統(tǒng)在持續(xù)壓力測試中的吞吐量提升約17%。在實(shí)際AI工作負(fù)載下,液冷系統(tǒng)在高利用率時(shí)節(jié)點(diǎn)級功耗也低約1至1.5千瓦,同時(shí)保持同等甚至更優(yōu)的訓(xùn)練性能。這些優(yōu)勢正推動(dòng)整個(gè)行業(yè)轉(zhuǎn)向液冷,盡管其工程復(fù)雜性也隨之增加。
Bluming指出,能夠在更高水溫下運(yùn)行的新一代D2C系統(tǒng),也正在重塑AI基礎(chǔ)設(shè)施的地理分布格局。"過去一年,我們看到了在密西西比州、阿拉巴馬州和路易斯安那州的重大數(shù)據(jù)中心公告。在AI熱潮興起之前,這些地方并不是數(shù)據(jù)中心建設(shè)的熱門地區(qū),而那里的氣候顯然是非常炎熱潮濕的。"他還補(bǔ)充說,部分新型冷卻技術(shù)能夠在比傳統(tǒng)冷凍水系統(tǒng)高得多的水溫下運(yùn)行,使大型AI部署在過去被認(rèn)為冷卻條件惡劣的地區(qū)也具備了經(jīng)濟(jì)可行性。
峰值需求的隱憂
來自UC河濱、加州理工學(xué)院和羅切斯特理工學(xué)院的研究人員認(rèn)為,整個(gè)行業(yè)正撞上一個(gè)鮮為人知的限制——供水峰值容量。他們在題為《小瓶子,大管道》的論文中警告,許多公共供水系統(tǒng)缺乏足夠的冗余容量,無法在極端夏季條件下吸收大規(guī)模AI冷卻負(fù)荷。
研究人員估計(jì),若當(dāng)前用水強(qiáng)度持續(xù)不變,到2030年美國數(shù)據(jù)中心可能需要每日6.97億至14.5億加侖的新增供水容量,大致相當(dāng)于紐約市的日均供水量。這一壓力將集中落在承接地所在社區(qū),而這些地區(qū)的公共供水系統(tǒng)本就不少已在老化或接近容量上限。
這種緊張態(tài)勢正在地方審批環(huán)節(jié)浮出水面,市政系統(tǒng)面臨的峰值需求場景,遠(yuǎn)超其設(shè)計(jì)初衷。
Ren告訴《數(shù)據(jù)中心知識(shí)》,市政系統(tǒng)在項(xiàng)目審查中通常會(huì)收到最大需求申請,但許多規(guī)模較小的系統(tǒng)在極端夏季條件下,當(dāng)下可能根本沒有這種峰值容量。當(dāng)"本地系統(tǒng)在不影響其他用戶的前提下無法可靠支撐項(xiàng)目峰值需求"時(shí),水資源就成為了選址的制約因素。
真正的難題是需求的波動(dòng)性。與大多數(shù)市政用戶不同,數(shù)據(jù)中心的峰值系數(shù)往往異常高——即日最大用水量與日均用水量之比。論文估計(jì),根據(jù)冷卻架構(gòu)和氣候不同,許多數(shù)據(jù)中心的峰值系數(shù)在3至10之間,部分設(shè)施甚至超過30。論文中分析了威斯康星州一家面向AI的超大規(guī)模設(shè)施,該設(shè)施申請的供水容量約為每日70萬加侖,而實(shí)際日均用水量僅約2.3萬加侖,意味著峰值系數(shù)超過30。
市政系統(tǒng)的規(guī)劃基準(zhǔn)并非年均用水量,而是一年中最炎熱的天氣。
研究人員明確揭示了這一權(quán)衡:"設(shè)施級冷卻在電力使用與用水之間存在根本性的取舍。"節(jié)水冷卻往往加重電力負(fù)擔(dān);節(jié)電冷卻往往加重用水負(fù)擔(dān)。
再生水可減輕對飲用水供應(yīng)的壓力,但同樣面臨自身的水力限制。
污水處理進(jìn)入AI基礎(chǔ)設(shè)施堆棧
公眾對數(shù)據(jù)中心的討論通常聚焦于淡水消耗,但市政系統(tǒng)同樣承受著排污壓力。大型冷卻系統(tǒng)產(chǎn)生的濃縮礦物質(zhì)和化學(xué)處理劑廢水,需由當(dāng)?shù)靥幚韽S進(jìn)行處理。隨著AI園區(qū)規(guī)模擴(kuò)大,無論城市是否有所規(guī)劃,污水處理系統(tǒng)正越來越多地成為計(jì)算基礎(chǔ)設(shè)施堆棧的組成部分。
在水資源緊張的地區(qū),運(yùn)營商正積極尋求再生水協(xié)議,以減少對飲用水系統(tǒng)的依賴。
在北弗吉尼亞州,供水基礎(chǔ)設(shè)施已在數(shù)據(jù)中心冷卻需求的推動(dòng)下持續(xù)擴(kuò)張。勞登水務(wù)正將其Broad Run水資源回用設(shè)施的處理能力從每日1500萬加侖提升至3000萬加侖,同時(shí)擴(kuò)建一條部分為"數(shù)據(jù)中心走廊"工業(yè)冷卻負(fù)荷配套建設(shè)的再生水分配管網(wǎng)。該系統(tǒng)包含約20英里的再生水管道,2025年已向用戶輸送超過7.45億加侖再生水。
在喬治亞州道格拉斯縣,谷歌利用經(jīng)過處理的市政污水冷卻設(shè)施,再將剩余水流排回查特胡奇河。即便是再生水系統(tǒng)也存在限制——?jiǎng)诘撬畡?wù)指出,隨著區(qū)域需求攀升,水力限制和容量分配可能制約新的再生水接入申請。
這一轉(zhuǎn)變正悄然將污水處理基礎(chǔ)設(shè)施改造為AI建設(shè)浪潮中的戰(zhàn)略性資源。歷史上各自為政的電力規(guī)劃、水務(wù)區(qū)、污水運(yùn)營和經(jīng)濟(jì)發(fā)展部門,正被AI基礎(chǔ)設(shè)施的需求強(qiáng)行整合到一起。
供水系統(tǒng)的擴(kuò)張正在復(fù)刻電網(wǎng)擴(kuò)張的軌跡:代價(jià)高昂、推進(jìn)遲緩、政治博弈復(fù)雜、受制于地理?xiàng)l件。水庫、新水源開發(fā)、處理能力提升和污水系統(tǒng)升級,往往需要數(shù)年乃至數(shù)十年才能完成。這些時(shí)間周期與超大規(guī)模云服務(wù)商爭分奪秒部署AI算力的節(jié)奏,正越來越多地產(chǎn)生沖突。
《小瓶子,大管道》的研究人員寫道:"并不存在什么供數(shù)據(jù)中心隨意取用的'國家水庫'。"
為另一個(gè)時(shí)代建造的基礎(chǔ)設(shè)施
數(shù)據(jù)中心基礎(chǔ)設(shè)施的討論長期以電力為核心,而AI改變了問題的量級。大型GPU集群將巨大的熱負(fù)荷集中在相對有限的空間內(nèi),迫使運(yùn)營商通過設(shè)施冷卻系統(tǒng),以及最初按照較慢工業(yè)增速規(guī)劃的市政供水和污水管網(wǎng),排出遠(yuǎn)超以往的熱量。
市政公用事業(yè)公司如今須統(tǒng)籌規(guī)劃冷卻峰值需求、污水處理容量、抗旱韌性,以及節(jié)水型與節(jié)電型冷卻架構(gòu)之間的權(quán)衡。與此同時(shí),許多公共規(guī)劃框架仍難以將AI基礎(chǔ)設(shè)施作為一個(gè)獨(dú)立的基礎(chǔ)設(shè)施類別加以建模。
弗吉尼亞州那份公用事業(yè)協(xié)議將AI系統(tǒng)的不間斷運(yùn)行與"持續(xù)蒸發(fā)冷卻以保護(hù)關(guān)鍵運(yùn)營所需敏感設(shè)備"直接掛鉤,同一份文件也承認(rèn),該項(xiàng)目的預(yù)期需求已超出公用事業(yè)公司現(xiàn)有的長期規(guī)劃假設(shè)。
《小瓶子,大管道》所揭示的壓力表明,水資源是一項(xiàng)硬性基礎(chǔ)設(shè)施約束,將決定新的AI集群能否獲批落地。
Bluming表示,隨著機(jī)架密度持續(xù)攀升,行業(yè)的長期冷卻走向正愈發(fā)清晰。"如果500千瓦機(jī)架成為現(xiàn)實(shí),那么液冷就是物理規(guī)律所決定的必然。"
這一切都指向AI基礎(chǔ)設(shè)施的一個(gè)新現(xiàn)實(shí):在許多市場中,下一個(gè)重大瓶頸或許不再是如何發(fā)出足夠的電力,而是如何獲取足夠的水——以及足夠的污水處理容量——來帶走熱量。
Q&A
Q1:AI數(shù)據(jù)中心為什么會(huì)消耗大量水資源?
A:AI數(shù)據(jù)中心運(yùn)行時(shí),服務(wù)器消耗的能量幾乎全部轉(zhuǎn)化為熱量,必須通過冷卻系統(tǒng)排出以防止過熱。傳統(tǒng)風(fēng)冷已無法應(yīng)對現(xiàn)代GPU集群的高熱密度,因此廣泛采用蒸發(fā)冷卻、冷卻塔等依賴大量水的系統(tǒng)。蒸發(fā)式冷卻雖可降低電力消耗,但會(huì)大幅增加直接用水量。此外,數(shù)據(jù)中心還存在間接用水,即發(fā)電過程中消耗的水資源,兩者疊加導(dǎo)致總體用水需求極為龐大。
Q2:液冷技術(shù)能解決數(shù)據(jù)中心的用水問題嗎?
A:液冷,尤其是芯片直接液冷(D2C)系統(tǒng)本身不會(huì)直接蒸發(fā)或消耗水,但并不能從根本上消除用水需求。設(shè)施仍需通過冷卻塔或其他方式將熱量排放至外部環(huán)境,水的需求只是被轉(zhuǎn)移而非消除。液冷的優(yōu)勢在于大幅提升散熱效率和GPU性能,測試顯示液冷配置可使吞吐量提升約17%,同時(shí)降低功耗,但整體水資源管理問題依然存在。
Q3:水資源短缺會(huì)如何影響AI數(shù)據(jù)中心的選址建設(shè)?
A:水資源正成為繼電力之后,影響AI數(shù)據(jù)中心選址的關(guān)鍵限制因素。部分地區(qū)的水務(wù)部門已明確表示無法滿足數(shù)據(jù)中心提出的每日數(shù)百萬加侖用水申請。研究預(yù)測,若當(dāng)前用水強(qiáng)度不變,到2030年美國數(shù)據(jù)中心每日新增用水需求可能高達(dá)14.5億加侖。這意味著開發(fā)商在評估選址時(shí),必須同時(shí)考慮供水容量、污水處理能力和長期抗旱規(guī)劃,而非僅僅關(guān)注電力供應(yīng)。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.