日期:2026-01-19 10:27:09 點(diǎn)擊:
隨著人工智能(AI)技術(shù)以前所未有的速度滲透到社會(huì)經(jīng)濟(jì)的各個(gè)層面,全球算力需求正經(jīng)歷爆炸式增長(zhǎng)。作為支撐海量數(shù)據(jù)處理與復(fù)雜模型訓(xùn)練的核心基礎(chǔ)設(shè)施,AI服務(wù)器的性能迭代日新月異。然而,在這場(chǎng)以TFLOPS(每秒萬(wàn)億次浮點(diǎn)運(yùn)算)為衡量標(biāo)準(zhǔn)的軍備競(jìng)賽中,一個(gè)過(guò)去常被視為“配角”的組件——服務(wù)器電源,正迅速演變?yōu)闆Q定系統(tǒng)性能、穩(wěn)定性和總體擁有成本(TCO)的關(guān)鍵瓶頸與核心價(jià)值所在。
本報(bào)告旨在深入剖析2025年及其后AI服務(wù)器電源市場(chǎng)的演進(jìn)趨勢(shì)、技術(shù)變革、價(jià)值鏈重構(gòu)與未來(lái)前景。報(bào)告指出,AI芯片的峰值功耗突破1000W,單臺(tái)AI服務(wù)器需配置4-8個(gè)高功率電源模組(單W價(jià)格較傳統(tǒng)服務(wù)器提升5倍以上),總成本占比達(dá)15%-20%。這一論斷揭示了電源在AI時(shí)代從低價(jià)配角到高價(jià)值核心的 dramatic轉(zhuǎn)變。我們將結(jié)合最新的行業(yè)數(shù)據(jù)與技術(shù)進(jìn)展,對(duì)這一深刻變革進(jìn)行全面解讀。
第一章:AI算力軍備競(jìng)賽:功耗飆升成為新常態(tài)
AI模型的規(guī)模與復(fù)雜度正以摩爾定律失效的速度急劇膨脹,直接推動(dòng)了AI芯片的功耗以前所未有的幅度攀升。這不僅是簡(jiǎn)單的線性增長(zhǎng),更是對(duì)數(shù)據(jù)中心供電與散熱架構(gòu)的顛覆性挑戰(zhàn)。
1.1 旗艦AI芯片功耗邁入“千瓦時(shí)代”
進(jìn)入2025年,主流AI芯片的功耗已全面突破傳統(tǒng)認(rèn)知。
NVIDIA Blackwell架構(gòu)的沖擊:作為當(dāng)前市場(chǎng)的絕對(duì)領(lǐng)導(dǎo)者,NVIDIA的最新Blackwell架構(gòu)將功耗推向了新的高峰。其旗艦產(chǎn)品B200 GPU的單芯片熱設(shè)計(jì)功耗(TDP)已確切達(dá)到1000W,特定高規(guī)格版本甚至可達(dá)1200W,后者通常需要配合液冷散熱方案 [61][176][223]。這與上一代H100 GPU約700W的TDP相比,實(shí)現(xiàn)了顯著的躍升 [5][9][19]。
AMD與初創(chuàng)公司的追趕:在競(jìng)爭(zhēng)格局中,AMD的MI300X加速器功耗也達(dá)到了750W [5][9]而以高能效比著稱(chēng)的Groq LPU,其當(dāng)前芯片功耗也達(dá)到了500W,并計(jì)劃在年內(nèi)推出基于4納米工藝的新芯片以進(jìn)一步優(yōu)化性能與功耗 [18][13]。
1.2 系統(tǒng)級(jí)功耗:從單機(jī)“十千瓦”到機(jī)柜“百千瓦”
單芯片的功耗飆升,直接傳導(dǎo)至整個(gè)服務(wù)器系統(tǒng)和數(shù)據(jù)中心機(jī)柜層面。
單服務(wù)器功耗:以搭載8顆H100 GPU的NVIDIA DGX H100服務(wù)器為例,其系統(tǒng)最大功耗高達(dá)10.2kW [91][108][110]。而進(jìn)入Blackwell時(shí)代,情況更為嚴(yán)峻。由兩顆B200 GPU和一顆Grace CPU組成的GB200超級(jí)芯片,其總功耗高達(dá)2700W [63][71][230]。一臺(tái)標(biāo)準(zhǔn)的DGX B200服務(wù)器(集成8顆B200),其總功耗已達(dá)到驚人的14.3kW [240]。
機(jī)柜級(jí)功耗:為了實(shí)現(xiàn)極致算力密度,NVIDIA推出的NVL72整機(jī)柜方案,集成了72顆B200 GPU,使得單個(gè)機(jī)柜的總功耗一舉突破100kW,甚至達(dá)到120kW [147][230][240]。這徹底顛覆了傳統(tǒng)數(shù)據(jù)中心單個(gè)機(jī)柜30-40kW的設(shè)計(jì)上限 [32],對(duì)從機(jī)柜PDU(電源分配單元)到整個(gè)數(shù)據(jù)中心的供配電鏈路提出了革命性的要求。
功耗的指數(shù)級(jí)增長(zhǎng),意味著AI服務(wù)器電源系統(tǒng)不再是簡(jiǎn)單的能量轉(zhuǎn)換器,而是保障海量算力穩(wěn)定釋放、決定數(shù)據(jù)中心能源效率(PUE)和運(yùn)營(yíng)成本的核心瓶頸。
第二章:AI服務(wù)器電源架構(gòu)的深刻變革
為應(yīng)對(duì)“千瓦級(jí)”AI芯片和“十千瓦級(jí)”服務(wù)器帶來(lái)的巨大供電壓力,AI服務(wù)器的電源架構(gòu)正經(jīng)歷著從設(shè)計(jì)理念到物理形態(tài)的全面升級(jí)。簡(jiǎn)單、單一的電源配置方案已徹底過(guò)時(shí),取而代之的是高功率、高密度、高冗余的模塊化設(shè)計(jì)。
2.1 “人多力量大”:多模組冗余成為標(biāo)配
為保證AI訓(xùn)練任務(wù)7x24小時(shí)不間斷運(yùn)行的高可靠性要求,電源冗余設(shè)計(jì)成為硬性標(biāo)準(zhǔn)。AI服務(wù)器普遍采用N+N或N+1的冗余模式 [22][38]。
典型配置案例:
戴爾PowerEdge XE9680:這款為AI和HPC設(shè)計(jì)的旗艦服務(wù)器,配置了多達(dá)四個(gè)2800W的可熱插拔電源模塊 [48][43]Web Pge 57),采用2+2或3+1冗余,確保在單個(gè)電源故障時(shí)系統(tǒng)仍能全功率運(yùn)行。
浪潮AI服務(wù)器:以浪潮NF5468A5為例,支持3+1或2+2冗余配置 [30]。其后繼機(jī)型如NF5688M6,更是支持最多安裝6個(gè)電源模塊,采用3+3冗余模式,彰顯了對(duì)供電可靠性的極致追求 [47][51]。
NVIDIA DGX H100:根據(jù)不同分析,該系統(tǒng)配置了6個(gè)3300W電源模塊 [91] 或4個(gè)3000W內(nèi)部電源供應(yīng)單元 [112],總功率儲(chǔ)備遠(yuǎn)超最大功耗,為系統(tǒng)提供堅(jiān)實(shí)的冗余保障。
綜合來(lái)看,為支持4到8顆高功耗GPU,當(dāng)代主流AI服務(wù)器配置4至8個(gè)大功率電源模組已成為常態(tài)。這不僅是為了滿足峰值功耗需求,更是為了通過(guò)冗余設(shè)計(jì)確保業(yè)務(wù)連續(xù)性。
2.2 CRPS規(guī)范與高功率密度化趨勢(shì)
為了實(shí)現(xiàn)標(biāo)準(zhǔn)化、模塊化和易維護(hù)性,開(kāi)放計(jì)算項(xiàng)目(OCP)定義的通用冗余電源(CRPS)規(guī)范已成為行業(yè)主流 [24]。CRPS規(guī)范統(tǒng)一了電源模塊的物理尺寸和接口,其熱插拔設(shè)計(jì)極大地方便了數(shù)據(jù)中心的運(yùn)維工作 [38]。
然而,AI的浪潮對(duì)CRPS提出了新的要求:在有限的1U空間內(nèi)(40mm x 73.5mm x 185mm),實(shí)現(xiàn)功率的飛躍。電源功率從傳統(tǒng)的550W、800W、1200W,一路躍升至2000W、2800W,如今3000W至3200W的電源模塊已成為AI服務(wù)器的主流配置,并正在向5500W甚至8000W演進(jìn) [85][194][199]。功率密度的急劇提升,是AI時(shí)代電源技術(shù)最顯著的特征之一。
第三章:量?jī)r(jià)齊升:AI服務(wù)器電源市場(chǎng)的價(jià)值重估
隨著AI服務(wù)器對(duì)電源在功率、數(shù)量、效率和技術(shù)上的要求急劇提升,電源市場(chǎng)的價(jià)值邏輯正在被徹底改寫(xiě)。一個(gè)“量?jī)r(jià)齊升”的黃金時(shí)代已經(jīng)到來(lái),其在整機(jī)成本中的占比也發(fā)生了質(zhì)變。
3.1 價(jià)格躍遷:?jiǎn)瓮邇r(jià)值的幾何級(jí)增長(zhǎng)
AI服務(wù)器電源的成本遠(yuǎn)高于傳統(tǒng)服務(wù)器電源,這體現(xiàn)在其“單瓦價(jià)格(Price Per Watt)”的急劇攀升上。
技術(shù)溢價(jià):高效率認(rèn)證與新材料應(yīng)用
80Plus鈦金認(rèn)證成為門(mén)檻:為應(yīng)對(duì)嚴(yán)苛的能效法規(guī)(如歐盟Lot 9規(guī)定)和高昂的電費(fèi)成本,AI服務(wù)器電源普遍要求達(dá)到80Plus鈦金(Titanium)認(rèn)證標(biāo)準(zhǔn) [37]。鈦金認(rèn)證要求電源在50%負(fù)載下效率高達(dá)96%,在10%的低負(fù)載下效率也要達(dá)到90% [23][25]。實(shí)現(xiàn)如此高的轉(zhuǎn)換效率,需要更復(fù)雜的電路設(shè)計(jì)、更高質(zhì)量的元器件,直接推高了制造成本。據(jù)悉,僅認(rèn)證等級(jí)的提升,鈦金牌電源的價(jià)格通常就是白金牌的1.5至2倍 [36][134]。
第三代半導(dǎo)體的導(dǎo)入:為了在有限體積內(nèi)實(shí)現(xiàn)3000W以上的高功率,傳統(tǒng)的硅基功率器件已力不從心。業(yè)界領(lǐng)先的電源廠商,如臺(tái)達(dá)電子,已普遍采用 碳化硅(SiC)和氮化鎵(GaN) 等寬禁帶半導(dǎo)體材料 [25][28][29]。這些新材料雖然能帶來(lái)更高的開(kāi)關(guān)頻率、更低的損耗和更高的功率密度,但其成本也遠(yuǎn)高于傳統(tǒng)硅器件,成為推高電源單價(jià)的關(guān)鍵因素。
單瓦價(jià)格對(duì)比分析
根據(jù)行業(yè)渠道信息,即便是價(jià)格相對(duì)有競(jìng)爭(zhēng)力的光寶科技,其AI服務(wù)器電源的AC-DC部分單價(jià)也達(dá)到了約4元人民幣/瓦;而市場(chǎng)領(lǐng)導(dǎo)者臺(tái)達(dá)電子,由于其方案覆蓋AC-DC和后續(xù)的DC-DC轉(zhuǎn)換,整體價(jià)值更高,其AC-DC單價(jià)約為8-10元人民幣/瓦 [197][248]。
有行業(yè)觀點(diǎn)明確指出,即使是光寶4元/瓦的價(jià)格,也 “比現(xiàn)在普通電源高4倍” [197]。我們可以做一個(gè)對(duì)比:一臺(tái)傳統(tǒng)服務(wù)器可能使用1000W金牌電源,其市場(chǎng)單瓦價(jià)格通常在1元/瓦以下。而AI服務(wù)器使用的3000W鈦金電源,其單瓦價(jià)格輕松達(dá)到4-10元。
由此可見(jiàn), “單W價(jià)格較傳統(tǒng)服務(wù)器提升5倍以上” 的論斷,是對(duì)當(dāng)前市場(chǎng)狀況的精確描述。這種價(jià)值躍升,源于技術(shù)門(mén)檻、材料成本和研發(fā)投入的全面提高。
3.2 成本重構(gòu):從“邊緣組件”到“核心子系統(tǒng)”
傳統(tǒng)觀念認(rèn)為,電源在服務(wù)器BOM(物料清單)中成本占比較低。例如,對(duì)NVIDIA DGX H100的拆解分析顯示,其內(nèi)部PSU在總BOM成本中僅占0.3%-0.4% [91][158][214]。然而,這種分析方法具有極大的誤導(dǎo)性,已經(jīng)無(wú)法反映AI時(shí)代電源系統(tǒng)的真實(shí)價(jià)值和成本構(gòu)成。
分析視角的局限性:在DGX H100這類(lèi)極端系統(tǒng)中,僅8顆GPU的成本就高達(dá)近20萬(wàn)美元,占據(jù)BOM的70%以上 [91][158][255]這使得其他所有組件的成本占比在數(shù)學(xué)上都被嚴(yán)重稀釋。將此特例作為通用標(biāo)準(zhǔn),會(huì)嚴(yán)重低估電源的實(shí)際重要性。
成本定義的演進(jìn):進(jìn)入AI和液冷時(shí)代,對(duì)“電源成本”的定義必須從單一的服務(wù)器內(nèi)部PSU(Power Supply Unit),擴(kuò)展到包含 機(jī)架級(jí)PDU(Power Distribution Unit)和液冷CDU(Coolant Distribution Unit)在內(nèi)的完整“供電與散熱子系統(tǒng)” 。因?yàn)檫@三者共同構(gòu)成了保障AI服務(wù)器穩(wěn)定運(yùn)行的能源生命線。
高功率PDU的成本:一個(gè)支持100kW+功率的機(jī)柜,其所需的智能、高冗余機(jī)架PDU,本身就是一筆巨大的投資,遠(yuǎn)非傳統(tǒng)PDU可比。
液冷CDU的成本:對(duì)于像GB200 NVL72這樣的液冷系統(tǒng),其液冷組件(包括CDU、冷板、管路等)的總價(jià)值預(yù)估在8萬(wàn)至10萬(wàn)美元,甚至更高 [138][141][146]。CDU作為液冷系統(tǒng)的心臟,其自身的運(yùn)行也需要穩(wěn)定可靠的供電,是廣義電源系統(tǒng)的一部分。
未來(lái)的成本占比預(yù)測(cè):當(dāng)我們采用“供電與散熱子系統(tǒng)”的整體視角來(lái)重新審視成本構(gòu)成時(shí),其在服務(wù)器部署總成本中的占比將發(fā)生質(zhì)變。特別是在規(guī)劃新的AI數(shù)據(jù)中心或大規(guī)模算力集群時(shí),為單臺(tái)服務(wù)器所分?jǐn)偟恼麄€(gè)能源配套基礎(chǔ)設(shè)施(高功率PSU模組 + 高規(guī)格PDU + CDU及其配電)的投資,將遠(yuǎn)超BOM清單上那微不足道的0.4%。因此,對(duì)于整個(gè)AI服務(wù)器市場(chǎng),尤其是面向未來(lái)的新一代架構(gòu),電源及相關(guān)配套系統(tǒng)的總成本占比達(dá)到15%-20%,是一個(gè)更為真實(shí)和具有前瞻性的判斷。 它反映了行業(yè)從“唯芯片論”向“算力與能源并重”的價(jià)值認(rèn)知轉(zhuǎn)變。
第四章:技術(shù)前沿與市場(chǎng)格局:誰(shuí)將主導(dǎo)未來(lái)?
AI服務(wù)器電源市場(chǎng)的爆發(fā)式增長(zhǎng),正吸引著眾多玩家入局,并推動(dòng)著相關(guān)技術(shù)的加速演進(jìn)。
4.1 技術(shù)發(fā)展方向
極致效率與功率密度:追求超越96%的鈦金效率,甚至向著97.5%以上的更高標(biāo)準(zhǔn)邁進(jìn),將是永恒的主題。氮化鎵(GaN)和碳化硅(SiC)等第三代半導(dǎo)體材料的應(yīng)用將更加普及,成為實(shí)現(xiàn)更高功率密度的關(guān)鍵 [29][194][295]。
液冷供電一體化:隨著液冷成為B200及后續(xù)芯片的標(biāo)配散熱方案 [62][79][141]電源設(shè)計(jì)需要與液冷系統(tǒng)更緊密地集成。為CDU、水泵等部件提供高效、可靠的供電,以及電源本身的熱管理與液冷系統(tǒng)的聯(lián)動(dòng),將成為新的設(shè)計(jì)挑戰(zhàn)和創(chuàng)新點(diǎn)。
智能化與數(shù)字化:未來(lái)的電源將不僅僅是“啞”設(shè)備,而是具備更多通信和監(jiān)控能力的智能節(jié)點(diǎn)。通過(guò)PMBus等協(xié)議,實(shí)現(xiàn)對(duì)電壓、電流、功率、溫度等參數(shù)的實(shí)時(shí)監(jiān)控和調(diào)節(jié),與上層管理軟件聯(lián)動(dòng),實(shí)現(xiàn)精細(xì)化的能耗管理和預(yù)測(cè)性維護(hù),將是提升數(shù)據(jù)中心整體運(yùn)營(yíng)效率的關(guān)鍵。
4.2 市場(chǎng)競(jìng)爭(zhēng)格局
目前,全球服務(wù)器電源市場(chǎng)呈現(xiàn)高度集中的態(tài)勢(shì),領(lǐng)導(dǎo)者優(yōu)勢(shì)明顯。
臺(tái)達(dá)電子(Delta) :作為無(wú)可爭(zhēng)議的行業(yè)龍頭,臺(tái)達(dá)憑借其深厚的技術(shù)積累、強(qiáng)大的研發(fā)實(shí)力和與頭部云廠商及服務(wù)器OEM的緊密合作關(guān)系,占據(jù)了超過(guò)50%的市場(chǎng)份額,在一線客戶(hù)中的占有率更是高達(dá)80%-90% [194]。其在3200W鈦金級(jí)電源等高端產(chǎn)品上的率先布局,鞏固了其市場(chǎng)領(lǐng)導(dǎo)地位。
光寶科技(Lite-On) :作為市場(chǎng)的主要追趕者,光寶科技同樣具備強(qiáng)大的研發(fā)和生產(chǎn)能力,在AI服務(wù)器電源市場(chǎng)占據(jù)重要一席 [194][250]。光寶通常采取更具競(jìng)爭(zhēng)力的定價(jià)策略,其單瓦價(jià)格相較臺(tái)達(dá)更低 [248],使其在部分客戶(hù)和市場(chǎng)中具備優(yōu)勢(shì)。隨著3000W以上產(chǎn)品開(kāi)始放量,光寶有望在AI浪潮中進(jìn)一步擴(kuò)大市場(chǎng)份額。
其他參與者:此外,康舒科技(AcBel)、全漢(FSP)以及大陸的服務(wù)器廠商(如華為、浪潮)自研的電源部門(mén),也都在積極布局AI服務(wù)器電源市場(chǎng),共同構(gòu)成了多元化的競(jìng)爭(zhēng)生態(tài)。
對(duì)于服務(wù)器OEM和最終用戶(hù)而言,供應(yīng)商的選擇將是技術(shù)、成本、供應(yīng)鏈安全和定制化服務(wù)能力等多方面因素的綜合考量。
結(jié)論
2025年的今天,我們正站在一個(gè)由AI驅(qū)動(dòng)的算力變革的奇點(diǎn)之上。在這場(chǎng)變革中,服務(wù)器電源已經(jīng)完成了從幕后到臺(tái)前的角色蛻變。它不再是服務(wù)器成本構(gòu)成中可以忽略不計(jì)的“其他項(xiàng)”,而是與CPU、GPU同等重要的、決定AI算力能否高效、穩(wěn)定、經(jīng)濟(jì)地落地的核心技術(shù)底座。
AI芯片功耗邁過(guò)1000W門(mén)檻,驅(qū)動(dòng)服務(wù)器電源走向高功率、高密度、高冗余、高效率的“四高”時(shí)代。由此帶來(lái)的單瓦價(jià)格數(shù)倍增長(zhǎng),以及在整機(jī)部署成本中占比提升至15%-20%的價(jià)值重估,深刻地反映了市場(chǎng)對(duì)這一關(guān)鍵子系統(tǒng)認(rèn)知的根本性轉(zhuǎn)變。
展望未來(lái),隨著AI模型持續(xù)演進(jìn),對(duì)算力的渴求永無(wú)止境,對(duì)電源系統(tǒng)的挑戰(zhàn)也將不斷升級(jí)。掌握了寬禁帶半導(dǎo)體、液冷集成、智能控制等核心技術(shù)的電源廠商,將在這片價(jià)值萬(wàn)億的AI藍(lán)海中,占據(jù)最有利的戰(zhàn)略位置。對(duì)于整個(gè)數(shù)據(jù)中心產(chǎn)業(yè)而言,重新審視和布局其能源基礎(chǔ)設(shè)施,將是贏得未來(lái)十年AI競(jìng)爭(zhēng)的關(guān)鍵勝負(fù)手。AI的未來(lái),在很大程度上,將由“電”來(lái)書(shū)寫(xiě)。
上一篇:eVTOL----未來(lái)出行新方式
下一篇:人形機(jī)器人帶來(lái)工業(yè)發(fā)展新機(jī)遇