英伟达GPU的电源主要来自多相电源系统与高压化供电架构,其功率需求随芯片性能提升而大幅增长,最高可达单卡2700W,单机柜功率突破120kW。以下为具体分析:
一、电源来源:多相电源系统与高压化架构
多相电源系统
英伟达GPU采用“多相控制器+DrMOS”的组合作为主流供电形式。例如:
V100/A100:至少需要16相电源解决方案(1颗多相控制器+16颗大电流DrMOS),AI服务器因搭载多张A100,单机新增多相电源产品价值量超300美元。
H100:MPS(芯源系统)为其提供多相电源解决方案,作为AI旗舰芯片的电源供应模组供应商,MPS的技术优势体现在5x6 DrMOS设计上,可解决散热问题。
高压化供电架构
随着GPU功耗突破千瓦级(如B200单芯片1000W、GB200达2700W),传统电力架构难以支撑,英伟达引入800V HVDC技术:
优势:通过高规耐高压PMIC(电源管理IC),实现800V直流电降压至54V直流电,适应芯片级0.8V-12V与系统高压输入的宽范围需求,确保电压精准控制与稳定输出。
技术依赖:氮化镓(GaN)与碳化硅(SiC)等第三代半导体技术,提升转换效率(如全碳化硅LLC拓扑效率可达98.5%)。
二、电源功率需求:从百瓦到千瓦的跨越
单卡功耗
消费级显卡:如RTX 4080(16GB)功率320W,系统最低要求750W;RTX 5080需750W-1000W电源(预留20%-30%冗余)。
数据中心GPU:
H100:功耗约700W,需多相电源系统支持。
B200/GB200:单芯片功耗达1000W/2700W,推动单机柜功率从20kW跃升至120kW以上。
整机功耗与电源配置
AI服务器:以搭载8张A100的服务器为例,单机新增多相电源产品价值量超300美元,电源功率需求从5.5-8千瓦攀升至13千瓦,未来可能继续提升。
散热挑战:高功耗导致散热需求激增,如GB200采用全水冷设计,电源模块需兼顾高效能与低发热。
三、电源技术趋势:高压化与智能化
高压化
技术路径:从12V供电升级至48V,再到800V HVDC架构,减少电力传输损耗,提升功率密度。
元件升级:超结MOSFET、碳化硅MOSFET等功率半导体向高耐压、大电流方向发展,支持高频操作(如1MHz以上)以减小磁性元件体积。
智能化
集成化:将多种电源管理功能集成到单颗芯片中,如Rambus推出的高效电源管理芯片,通过深度优化算法降低内存供电损耗,提升系统电力效率15%。
可配置性:电源管理芯片内部参数可配置,并提供通讯接口供外部CPU实时调整,甚至具备数字运算功能。
四、典型案例:英伟达GPU的电源解决方案
H100的电源设计
采用两级降压结构:第一级为切换电容转化器(48V→低压),第二级为串联电容器降压(10路输出,支持1500A电流)。
定制电感尺寸优化至18.5x10.5x3.2mm³,集成度提升,系统高度降低1.1mm,支持垂直供电。
GB200的电源挑战
功耗达2700W,需解决DrMOS过热问题。英伟达曾测试AOS的5x5 DrMOS,但因过热可能转向MPS的5x6 DrMOS(散热效能更佳)