TA的每日心情 | 擦汗 2026-3-17 22:01 |
|---|
签到天数: 1133 天 [LV.10]大乘
|
沙发

楼主 |
发表于 2026-2-26 21:43:21
|
只看该作者
后来想了想,我让龙虾爬了一个分析全球AI数据中心建设和运营成本的报告,内容如下:
9 X6 U1 P7 |- J- k9 F
" o+ `# Q: ?2 g一、总体分析框架与核心结论! J3 Q; c0 V6 t
1.1 分析框架概览/ s1 z9 o- M2 D, K1 `4 ?9 M
拆分维度
: T4 h+ C6 A D P+ I! E
i( w9 L- o" a ` x4 h" ^阶段:; f+ M$ w9 {, z' s+ D* u9 }
建设期(CAPEX):土地/建筑、供电与配电、制冷、IT 硬件(GPU/TPU/加速卡)、网络与其他基础设施
2 G5 S( U3 t1 |0 ?! S/ \/ w运营期(OPEX):电力、水、运维人员、场地/托管、维护与更新、网络带宽等( [9 d# A: u; b' k$ C7 C
区域:
! C) o/ E5 q5 H/ }% R9 _中国、美国、欧洲、中东(以海湾地区/UAE 为代表)
& t/ d7 D1 {4 f9 E; n技术方案:3 u. U% F0 I7 i" h
NVIDIA(H100 / H200 / B200 / GB200 NVL72 等)
6 p! `: m8 s/ p6 i' h1 yGoogle TPU(v5e/v5p/Trillium 等)2 W! H% |- M6 y! t% w& v
中国芯片:华为昇腾 910B / 910C 系列、阿里平头哥真武 810E(PPU)
+ L4 a A& N: u' F G3 Q0 t8 n& B算例基准
" w9 D. S) Y" U8 x
4 k3 _/ M! D7 S4 @以400 MW 级 AI 数据中心为统一标尺(与 ChinaTalk BOTEC 分析保持一致)[1]:
/ v, x- J8 i( H+ V其中 IT 有效功率约 360 MW:GPU/AI 加速约 312 MW,CPU/存储约 48 MW
- _! W) }4 o' B6 }PUE 假设约 1.11(高效液冷场景)[1][29]
/ P7 {1 f, s8 d+ u$ M! S, k时间窗口:3–5 年运营期(与行业 TCO 分析和硬件折旧相匹配)[28]
- ~4 m( j4 a" k关键指标) c, u3 @. o8 `) M# ?5 k
# b" v9 C# [: J% O9 O7 W ?
$/MW 建设成本(含/不含 IT 硬件)
) K! C7 K8 p) \- L1 u# D( C _) F$/kWh 电力成本、L/kWh 水耗
) {0 v. F- V5 |" O4 T) B$/token 或 $/百万 token 的综合成本
5 X6 n0 D7 ^" t6 h4 a8 rToken-per-watt / Joule-per-token 作为能效基准[17][18][26]
; { ~3 W9 S0 l9 N% u$ Y项目 IRR/回收期、吨位级 TCO 对比(自建 vs. 云租)
* Z6 u* p9 ^! c1.2 高层结论(供决策快速参考)* a& @1 v/ v" H# j* h# E5 A/ i
建设成本:AI 数据中心相对传统云数据中心成本翻倍
H q1 B% R" c5 v8 y7 R; f; ]/ I! e5 a: o/ b3 i7 f9 Y
传统云数据中心壳体+机电平均约 $10.7M/MW (2025),预计 2026 升至约 $11.3M/MW[2][41]。0 b: q5 e) K2 @! b. O
AI 优化数据中心(高功率密度 + 液冷)壳体+机电可高达 $20M/MW 甚至更高[41]。1 i8 B. H6 ^0 _2 f3 u
按 Accenture/Soben 研究,传统云 DC 为 $8–10M/MW,而 GW 级 AI 数据中心可达 $17M/MW(仅壳体+机电,不含 GPU)[3]。
9 C6 B4 n# r, s7 Z- P# j8 z r区域 CAPEX:中东≈中国 < 美国≈欧洲 < 高端 AI 园区) s2 E1 u/ \1 R
0 P& P$ W2 A( ]9 Y) S8 @
中国:$5.5–6.5M/MW,400 MW 约 $2.4B[1][13]
& ^) W; h; N1 d美国:$8–12M/MW,400 MW 约 $4.0B[1]
2 J, f' M8 K3 [$ K4 x Q欧洲:接近全球平均 $10.7–11.3M/MW[2][41]; t6 P$ `! \( e. q( n
中东(UAE Stargate 5 GW):总投资超 $30B,约 ≥$6M/MW[20]3 ]" p1 U& v, O w' a: @$ }
结论:中国与中东的壳体+机电 CAPEX 明显低于美国/欧洲,同等规模下节省约 30–40% 构筑成本。( e6 b4 \- S. G0 D6 b* n
OPEX:电价与人工决定区域优势# D! ~9 V& F$ [4 S/ U
- C, i9 J) W0 g, A: \* m! x4 P
电价(2025–2026 工商业大致区间):
* m7 U% i7 |5 P$ d9 Q* U中国:约 0.8–1.1 元/kWh ≈ $0.08–0.11/kWh,部分算力基地可通过长协拿到 ≈3 美分/kWh[12][73]
- e! ~4 V* b; D5 [0 M( m1 G7 R$ w美国:工业用电约 $0.085–0.09/kWh[44]( {) w* I& Y( F; ]
欧洲:非居民平均 €0.19/kWh ≈ $0.20+/kWh[45]' g, A: U! |+ [( j* [& Y
中东/UAE:工业用户 $0.07–0.13/kWh[47]
! E: T% n, O# t3 `, S" n( L人工:
# l6 @; } ]& ]# {中国数据中心运维:约 $22k/人/年0 X* G6 Z8 Z# d8 L( _( Q, _( E
美国数据中心运维:约 $120k/人/年[1]
{4 g& \- H, X2 Z3 u& e结论:电价上中国西部/北部与中东有显著优势,人工成本上中国远低于美欧。
7 P! t4 [( }- V$ _8 |2 ^' C- Y能耗与每 token 能源成本:能效差异远大于电价差异
3 t4 x4 ~0 W$ }
; F7 ]1 A V, M4 j5 n1 Z8 }IEA:2022 全球 DC+AI+加密耗电 460TWh,2026 可能至 620–1050TWh[86][90];AI 专用服务器约 90TWh 量级[30][90]。- K) ~$ b7 _6 L8 M3 g
大规模 LLM 推理能耗估算:H100 集群训练 GPT-3 175B 约 2.46–3.63 J/token(训练)[10][16];经推理优化后,Inference 端典型可做到 0.4–1.0 J/token 级别[17][26]。
/ m, H5 j/ I2 `3 ~将 token 能耗约化为统一口径:% u* ~# n3 t6 B+ H5 g9 s
粗略取 1 J/token = 2.78×10⁻⁴ Wh/token。若电价为:
. s$ r( s- N( c/ U- X- o8 s中国 0.3 元/kWh ≈ $0.042/kWh:电费 ≈ 1.17×10⁻⁸ $/token ≈ $0.0117/百万 token5 ?; v3 Q7 @$ W% N
美国 $0.30/kWh(题设):电费 ≈ 8.34×10⁻⁸ $/token ≈ $0.0834/百万 token2 x: X5 b( L9 b
对比:OpenAI GPT‑4.1 / GPT‑5.2 系列对外 API 输出侧价格 $8–168/百万 token[62],电费占比 远低于 1%,真正决定成本差异的是硬件 TCO 和利用率,而非电价本身。
; n& j5 `1 l0 q不同芯片方案的核心差异 }( H! ^& X/ P, f+ C
* F; c! h+ q* i6 W, A
NVIDIA Blackwell/B200 & GB200 NVL72:1 y' h# y9 m1 q6 y- A) L
单 B200 GPU 峰值 ~4.5 PFLOPS FP4/FP8,功耗 600–1000W[68][69]。6 ]3 q3 R% [, x- ^
GB200 NVL72 整机架售价约 $3.0–3.35M,72 GPU[34][69],GPU 约占整个 AI 数据中心总 CAPEX 的 39% 左右[36]。6 ~; ?. S1 J7 W. g! P+ [/ j+ M
Google TPU v5e/v5p/Trillium:& z e: q0 ~4 r; d. B7 o
TPU v5e 8 芯推理:约 2,175 tokens/s(Llama2‑70B,INT8)[67];功耗显著低于 H100,同负载下能耗可降约 5 倍[67][52]。8 \( ]( N: `2 |& Z* C J
Google 内部披露 TPU v5 能效约为 H200 的 1.46×,Trillium/TPU v7 更高(约 2× 甚至以上)[52][65]。4 L6 I6 i4 m' L$ q- D
华为昇腾 910B:8 Q# S( s I& {0 _, O
FP16 算力 320–376 TFLOPS,INT8 640 TOPS,TDP ≈ 310W[80][81][82];能效接近甚至超过 A100,在长序列推理上 token-per-watt 可超 H200[71]。
" i4 X# y: U$ k. ^( K: c4 d+ g0 ^6 a单芯片成本约 5 万元人民币 ≈ $7k[60],显著低于受限版本 H20/H100。! M3 \( o8 G; y5 b H. ~8 e
阿里平头哥真武 810E(Zhenwu PPU):
/ ?3 K$ m. G* Z8 f* H96GB HBM2e、700 GB/s 互联带宽[59][111],功耗约 400W 级别[102],整体性能对标 NVIDIA H20/A800,并已形成万卡集群部署[59][111]。) y) Y1 z: ^1 |2 O* h
结论:
) i, n& p" k; ]' i8 n( ~$ R* q能效(tokens/J 或 tokens/W)排序大致为:Google TPU v7/Trillium > NVIDIA B200/GB200 > TPU v5e/H200 ≈ 华为 910B ≈ 阿里真武 > H100/A100。* |/ }6 w' f9 `9 [) }& L4 ?
单芯片/整机价格排序:华为/平头哥 < TPU 自用成本(Google 内部) < NVIDIA 公版(H100/B200/GB200)。& `/ @! Q4 B0 a, X9 F
对中国市场,在算力性能足够的前提下,昇腾 + 真武 方案的 CapEx/每 token 成本有 30–60% 的价格优势。
7 } y% d9 P2 d8 L. h7 ]& r) R7 y自建 vs 云租的 TCO 与 token 成本
1 y, `4 F% J9 C$ B; ~; u# q& N! J6 n# ^3 ^
LenovoPress 对 8×H100/H200/B200/B300 本地 vs AWS/Azure/GCP 的 5 年 TCO 对比[28]:
2 @$ q5 r8 [1 ^: I9 Z8×B300(Config D)自建 5 年 TCO ≈ $1.01M;% F8 M) Z) ^2 ~( h" d3 s
等价 AWS p6‑b300.48xlarge(24/7)5 年 ≈ $6.24M,节省 83.8%。
) v, n @- H; l8 `8 ^- O8×H100(Config A)自建对 Azure On‑Demand,回本点约 2,720 小时(~3.7 个月),对 1/3/5 年保留分别约 4,423/6,800/7,591 小时(~6/9.3/10.4 月)[28]。$ c g2 E/ l) d" k: y( A2 s. g' D
Token 成本对比示例(LenovoPress 场景)[28]:
6 l, O+ L; z- C" OLlama‑70B 推理,8×H100 本地:约 $0.11/百万 token1 b B1 g/ R& P6 f
vs Azure H100 On‑Demand:$0.89/百万 token → 自建 ~8× 便宜。2 ^2 V0 y( @: a# K
同样 70B 模型,自建 vs GPT‑5 mini API(约 $2/百万 token):自建便宜约 18×。$ Z# Z0 \: l! i& i6 y
Llama‑405B,8×B300 自建:$4.74/百万 token,AWS B300 On‑Demand:$29.09/百万 token → 节省 ~84%。
/ P/ H: H) e7 W结论:
$ b$ _. l* A/ D; Z; X4 S高利用率、长周期推理负载下,自建 AI 数据中心的每百万 token 成本可比公有云或高端闭源 API 低 1–2 个数量级。* I5 f4 k; ]) q3 r: R
Token 电费占比极低,自建 vs 云租的差异几乎全部来自 硬件折旧 + 云溢价 + 运维与利用率。
2 |+ `$ u2 v) A0 x$ H& f1 U二、建设期成本分布:区域对比
* A- r8 r& p9 [* g, p# T以下重点讨论 壳体+机电(不含 GPU) 与 全栈(含 GPU) 两层。
# R/ b! Q# m8 P9 _0 i3 l$ L
8 Y2 d3 n9 J* U) ~9 C2.1 全球/通用结构(以 1 MW 为单位)
3 a0 t- \- ?; ]5 C1 D综合 JLL、ConstructElements 等[2][41][40]:+ S: b5 p* m4 s: S2 _
) A6 ]. m) J5 w$ n. C7 S壳体+机电(Shell & Core)( G# B0 t7 T1 k. ~- f
9 c4 s1 |- E; X8 g3 N% F" t全球传统 DC 平均(2025):$10.7M/MW,2026 约 $11.3M/MW[2][41]
* I9 j8 R# a) I* b6 @其中按成本构成[40]:
; O( J4 d( o& o( p- o4 B# l8 R电力系统(变电、配电、UPS、母线等):40–50%
- R! E6 z2 S5 e% ]9 P机械与冷却(冷机、冷却塔、管路、CRAC/液冷):15–20%& ]+ p$ ?! d" y9 c
建筑与土地、结构:约 15–20%( d# N+ w% `. R, t
其他(消防、安防、楼宇管理等):约 10–15%' t0 E- d3 l2 B$ y C4 G
IT 内装与 AI 基础设施(不含芯片)! Y ]/ i" ^9 N; U5 F
" }7 C- B8 I1 P, v* o# S
高密 AI 集群内部装修(高密布线、机架、液冷板/浸没舱等)会在每 MW 额外增加 $25M/MW 量级[40],对 GW 级园区影响巨大。0 U, z3 R, b' y3 [% O$ U# L- ?
GPU/加速卡硬件 CAPEX: i; T" w+ s! e5 `* e# N' R
: i3 H p/ q0 S; F
多数分析认为 GPU 占 AI 数据中心总 CAPEX 的 30–40%,其中 NVIDIA 单家毛利约等于整个行业 CAPEX 的近三成[36]。
+ p& X z5 T$ n/ `. {2.2 中国 vs 美国 vs 欧洲 vs 中东:1 MW 建设 CAPEX
! l8 Y# C. Y& l* x- g结合 ChinaTalk、JLL、UAE Stargate 等[1][2][20][13](仅壳体+机电):; l7 n r1 ]0 p* x* P: A. V4 [
5 l P' L* a/ b2 H" M区域 典型建设成本(壳体+机电,$M/MW) 备注
* q, S$ A; }7 D9 V中国 $5.5–6.5M/MW 以西部算力基地为主,400MW ~ $2.4B[1][13]
- E, Y0 }) R5 k; D+ J2 O6 M% t5 r6 s; p美国 $8–12M/MW 典型超大算力园区 400MW ~ $4.0B[1], c. B4 n4 d u/ v1 f9 c+ r0 i
欧洲 $10.7–11.3M/MW 接近全球平均,部分核心城市更高[2][41]; x1 _4 H7 o+ B; {8 {2 f
中东 ≥$6M/MW UAE 5GW Stargate >$30B → ≥$6M/MW[20]
7 X: C7 r8 `0 N9 w4 t# m& c6 {结论:' v8 z8 d! e( ~4 O8 V0 I
, P- a1 M$ S3 x单位 MW 壳体+机电 CAPEX:中国 ≈ 中东 < 美国 < 欧洲。' X' Y+ R& G- `) A& _
若考虑土地、电网接入和许可周期,中东(特别是 UAE/沙特)在电力可得性和政府补贴方面往往优于欧洲,趋近美国甚至中国。
. v4 D) Q/ \1 _ x- f0 @, J2.3 引入 GPU 后的全栈 CAPEX(以 400MW 集群为例)
' u- m) P4 q- t7 Q p& e9 ]1 X以 ChinaTalk 的 400MW NVIDIA GB200 NVL72 集群为例[1]:% F8 J: K# z0 z4 s) F, t
! \$ F! @, v$ P- T+ Q7 B
假设:PUE=1.11,电力侧 400MW,中约 360MW 投入 IT;( c5 \" r7 S. G6 S$ j% W
GPU 配置:
( j8 g4 p! [/ W2 {1 w有效 312MW 用于 GB200 NVL72,约可容纳 2,154 racks(每 rack 144 GPUs,对应功耗 ~145kW/rack);8 e8 d: F$ E5 e: D/ S; L/ L8 R' j
每 rack 成本 ≈ $3.0–3.35M[34][69];
. u; z' I' ]. o/ u. aGPU 总 CAPEX ≈ $6.5–7.2B 量级(ChinaTalk 抽样约 $5.6B 略保守[1])。0 y9 k( d2 z c O- }
与不同区域壳体+机电组合:# C# P/ n$ Y) [, s$ W% q7 c
& V8 f6 J- Q/ {6 r) ?, J
以中值估算:, ^4 m" s: F3 ?' X6 Z4 d2 W8 A7 Q
0 c. N/ ?7 Z% r4 |/ @! p: x中国 400MW:壳体+机电 $2.4B + GPU $5.6B ≈ $8.0B- d% M$ H. c: [6 W: A8 i, r
美国 400MW:壳体+机电 $4.0B + GPU $5.6B ≈ $9.6B* X" u. W# k( r D |/ y% V& }
欧洲 400MW:壳体+机电 $4.5B + GPU $5.6B ≈ $10.1B
0 o1 M' U& y2 V中东 400MW:壳体+机电 $2.4–2.8B + GPU $5.6B ≈ $8.0–8.4B0 ~, [5 ^2 K, o0 u l4 t* w0 p
可见:0 g/ ]# {! ?) L4 m7 A" O& E, @3 }- T
8 P9 K) y" _% O, }/ A
GPU 成本在各区域大致相同,决定区域 CAPEX 差异的主要是壳体+机电与土地/电力接入。; g* H8 p0 f% u8 c2 i
相比美国/欧洲,中国和中东可在 400MW 级别节省约 $1.6–2.1B CAPEX,这对 IRR 有直接影响。
) ~5 {6 V' \; e1 J! x# [% F& I三、运营期成本结构与区域对比 C5 `9 A/ W9 E: r7 F, F0 Y
3.1 通用 OPEX 结构(高密 AI DC)2 x$ V/ u9 G5 ^" n" w
结合 ConstructElements、IEA、Microsoft/Google 披露[40][86][103][104]:; E; z# f* [5 b2 b% g/ j
+ B* `0 k8 P4 {4 H; t电力:约占总 OPEX 的 20–30%(传统 DC),对于 AI DC 因 GPU 负载密度提升,可达 30–40%。
4 i$ i1 \7 Z4 r2 P; D- T+ g冷却与水资源:
0 A m' @/ R! w1 }3 W能耗:传统风冷约占总功耗 30–40%[39];液体冷却可将 IT 与制冷合并大幅降 PUE 至 1.1 左右[29][115]。
5 t8 c; M( P. H水耗:典型 DC 约 1.9 L/kWh 水用量[105],每日用水可达 300,000–5,000,000 加仑 规模[100][101]。
1 x: u& ~* s" g% \8 I人工:视地区而定,在中国/印度/东南亚占比 5–10%,在美欧可达 15–20%。
, @5 r' t7 j1 L. A6 K9 J托管/物业与维护:
/ c4 ~. v' I& ?# w/ ?0 q托管:高密机架约 $1,500/机架/月,标准机架约 $600/月[40][28];
* r( b+ Y- q+ \0 H( l) h硬件维护:LenovoPress 模型中按设备价 12%/年[28]。+ r: Z) w8 g, J" {
3.2 区域差异(以 400MW / 3 年期为例)
. {* N ^$ O5 ^ g" q1 n使用 ChinaTalk 的电费与人工估算[1]:
0 O( ^+ ], q( j5 W$ y- Q6 S$ p) j, E* U. D" V
电费(3 年) – 假设 GPU 利用率 60%,IT 360MW,PUE=1.11:, n. R/ S3 {9 ]9 G
中国:约 $0.06/kWh → 3 年电费 ≈ $350M
; [" Z5 }* j7 B# F" V' U& a美国:约 $0.09/kWh → 3 年电费 ≈ $600M
9 Z% s, T2 g5 f5 z" X1 O2 N中东:约 $0.07–0.10/kWh → $400–550M
. p y# c8 |- i) V4 [欧洲:约 $0.20/kWh 以上 → 电费 > $1B(显著劣势)9 ^" W0 Q1 q& `8 E+ H! [4 F3 g
水费(3 年) – 以 MS Fairwater 站点 280 万加仑/年为参照[1][103]:
1 ^7 v- N( a& I! W+ g5 a% @3 T美国水价约 $5.18/千加仑,中国约 $2.57/千加仑[1]# `' r }- K" N
三年水费级别:) g8 K" u) c3 l, Y! q
美国:$40k+
: S; J9 d0 Y6 U4 h3 H9 Y; u中国:$20k+2 e1 J' E& d$ C+ F1 G4 S
结论:水费是数量级上可忽略的小项,真正的约束是水资源总量与选址,而非成本。
6 _ Y' k0 X" d6 ?; U- C人员成本(3 年) – 假设 500 名全职运维:
' A: r2 x; D. }# ?3 O美国:500 × $120k × 3 = $180M+. g' @! A, Q" G6 Z% ?" Q, [3 _
中国:500 × $22k × 3 = $33M+
, p) `$ w% e2 Q( N差异约 $150M,规模与 3 年电费差不多,是中美间第二大成本差异来源。
: M, _ A1 W" Q. A整体 OPEX 粗算(3 年) – 400MW 场景下:6 o! E M2 x/ q$ J& [( c1 R
2 U8 X) b4 n0 f
项目 中国 美国5 N' B6 P4 q+ y
电费 $350M $600M# g5 h; t4 A! c4 \- X
水费 <$0.05M <$0.05M
! j e6 E% `6 o, j人员 $33M $184M
4 C5 a8 u4 N6 K$ O0 W其他维护/托管 同比例估算,地区差异主要体现在人工与地价
8 ], L$ f/ a( Z2 C5 w- K结论:+ \. y3 \" E8 W e! A
: g7 y: Y, I) f: d2 ~8 M" G; |就 3 年期而言,中国与中东在 电价+人工 两项合计可比美国/欧洲节省 数百百万美元级,与整体 CAPEX(数十亿美元)相比不算决定性,但对净现值和现金流有实质贡献。! i$ A# B: q# U! ?' m
对大模型服务商而言,更核心的是 GPU TCO 与 token 单价之间的剪刀差,而电价更多影响“边际利润率”而非“能不能赚钱”。
: a' x' n+ o& e5 Y, d3 `四、基于 token 的成本与利润推演, c6 @0 M `+ c( \
4.1 能源维度的 token 成本(题设 0.3 美元 vs 0.3 元)4 A0 ?6 h: T* ]/ V" y
统一假设:* `/ x2 }- q+ A- y* [9 D/ E
& W6 M% U4 A; p& t# v* c
典型大模型推理能耗:约 1 J/token(考虑 FP8/BF16 优化、Batch=256–512 时的能耗甜点[26][17][18])
8 H q5 ~2 `: F$ @1J = 2.78×10⁻⁴ Wh → 每个 token 约 2.78×10⁻⁴ Wh
' D0 y# L$ s' w1 百万 token:278 Wh = 0.278 kWh2 |# R& l$ O) a0 t. n% G) @
场景 A:美国电价 $0.30/kWh9 X3 @& L6 q! _/ y2 B
电费/百万 token = 0.278 kWh × $0.30/kWh
% N4 M- L. j) Z9 S; T, T) o≈ $0.0834 / 百万 token m) }( O2 `0 |- I
场景 B:中国电价 0.3 元/kWh ≈ $0.042/kWh
4 j7 E# r: [6 N4 Y1 A/ F电费/百万 token = 0.278 kWh × $0.042
/ N* Z$ A% ?. T6 q. g( O9 P8 Q. C≈ $0.0117 / 百万 token
+ `4 ]% T8 a3 p3 C7 r对比当前 API 价格(OpenAI 2026Q1)[62]4 a) C: a; w7 c
以输出侧为主(成本最敏感):
/ _8 o; ^( Y2 R1 g( V9 p U; C" d
7 i0 P, {4 r1 Q" L模型 输出价 ($/百万 token)( c$ p. G& v; m
GPT‑5.2 $14
# x& B, Z, I' t* {$ v5 } K6 UGPT‑5.2 Pro $1687 u9 ^: L- C% d1 s1 q& v, Y# s
GPT‑4.1 $8
' A2 _; o, g" W6 C" f, \% k% vGPT‑4o $10
5 r( P% e$ n5 x# ^- V- lGPT‑4o mini $0.60
) K1 T% X2 f6 _& y. J* Q3 V则:# |' J, S) w, d. J
, j5 O- K4 c, q, j
在美国 $0.30/kWh 的极端高电价下,电费占 GPT‑4o mini 收入的 ~14%(0.083/0.60),占 GPT‑4o 仅 0.8% 左右。
3 E8 o4 h; ^8 E( i5 f E在中国 0.3 元/kWh 下,电费占 GPT‑4o mini 收入的 ~2%,占 GPT‑4o 的约 0.1%。+ I$ o; P" F/ k: H& {. H7 ]( C1 \% o
相比之下,GPU 折旧+云溢价+开发/运维成本才是主导。, P! O/ u0 E0 q3 q G
结论:
: o5 U0 n2 I& R2 h6 [0 B6 w即便在“美国 $0.30/kWh vs 中国 0.3 元/kWh” 的极端对比下,每百万 token 电力成本差异约 $0.07,与主流 API 价格($0.6–$168/百万 token)相比仍属“小数点后两位”的影响。区域电价主要调节“利润率边际”,而不会改变“项目能否盈利”的结论。. a# i, a! [7 n
5 _# D" c7 b8 V, N. ~4.2 全成本 per token:自建集群视角(基于 LenovoPress TCO)
m' C6 c9 r1 }% K) K0 ]以 LenovoPress 的 8×H100 Config A 为例[28]:
+ H# q) Q" w- i9 B$ s: s9 V' Z+ q
. D+ i, S" f0 _" w5 年摊销下,8×H100 本地推理 70B 模型:
7 u( e+ W1 j( M. S1 a3 F3 O$ o小时综合成本(CapEx摊销+Opex):$12.08/h; Q/ y# c9 r7 b$ @1 j7 W% ~* H. T r
吞吐:30,576 tokens/s → 每小时 ≈ 110M tokens
4 L5 s+ H% S5 J* B成本/百万 token ≈ 12.08 / 110 ≈ $0.11/M token
5 s. ~+ I( P' f' n电费在其中的占比:
( K, v0 a% e0 T7 ?4 ^9 h0 MOpex 6.37$/h 中电力+冷却约 $0.87/h[28]
% x" x9 {: ?8 u& F电费/百万 token ≈ 0.87 / 110 ≈ $0.0079/M token
: x( U# I' A* A. f0 d \电费占 总 token 成本 ~7% 左右。
. H4 I8 T2 ?2 E _5 F0 k若将美国电价从 ~$0.12/kWh 提高到 $0.30/kWh,则电费约增 2.5 倍,对总 token 成本影响约 +10–15%。2 A, P% h4 Y. k' ^
若迁至中国西北 0.3 元/kWh 或中东低价长协,电费可再降 40–60%,总 token 成本再降低约 5–10%。
! ]$ C/ {$ Y- d8 O) [: p2 Q y/ j3 i s, e( q
因此:
# A: C' j) \* A
* |3 G7 w! v, _1 G5 i2 x) h8 l1 Z在自建集群场景下,电价对 token 成本有可见但非决定性的影响(变化量级在 ±10–20%)。3 h: m% F' M- Q& B& K3 j0 }4 E0 g
在云租和 API 模式下,电价影响则被进一步摊薄,绝大多数利润被云厂商的溢价和 GPU 供应链吸走。
" ~# w0 X, Z' x2 a8 d5 ^4 e五、不同芯片方案的建设与运营成本对比
4 D' r# g5 T5 B5.1 NVIDIA 方案(H100/H200/B200/GB200)
7 J, @! {$ m4 \+ n6 ]9 a1 jCAPEX:
2 m, H% r/ P6 f) K& G3 I4 [8 Y8 u/ u( O A7 A
H100:单卡市价 $25k–35k,8 卡服务器约 $250k+(Lenovo 配置价 $250k 左右)[9][28]。
# k( Y& ?+ h* T+ O6 ~! nH200:显存提升,单卡价更高,8 卡节点约 $280k[28]。
5 B- ]# A; V0 h0 ?6 NB200:Blackwell 代 GPU,8 卡服务器约 $338k[28]。
, `% R. C* T o8 oGB200 NVL72:% S0 N* |% N3 M* j
每 rack 带 72 GPU + 36 Grace CPU,售价约 $3.0–3.35M[34][69]。
( g6 q7 b3 F1 W" H3 `冷却系统每 rack 额外 $50–56k[35]。# D: P, a- S' n. m e" y8 @
在 400MW 场景中,GPU 总 CAPEX 约 $5.6–7B,占总体 CAPEX 近 40%。
' K- j" A& Q. DOPEX & 能效:+ C2 ?/ L4 \0 b% [8 S
. y a8 R' p/ y
单 GPU 功耗: R# O5 T" _ D( t
H100:TDP 700W;集群实际单 GPU 含服务器/网络开销可到 ~1,500W[16]。! i% w" a& V4 A' g
H200:功耗类似或稍高,但性能/W 提升[9][10]。# j. S' F7 _5 l. E
B200:标称 1,000W TDP,但实测约 600W 左右[68][69]。
) J% w5 A* H; o6 g! TToken 性能:
1 U" z- j; r& z C5 b6 X& oB200:官方推理基准中,可达 60,000 tokens/s/GPU 级别(gpt‑类模型)[68]。4 ?+ S& d# s) }% Y) p
NVIDIA 的优势:
: B7 }7 o' a4 Y% g% n# b: W9 H3 l" E
软件栈成熟(CUDA/TensorRT‑LLM),易于榨干硬件性能,batch 与多 GPU 并行调度成熟 → 在同等 PUE 与模型条件下可达更高 tokens per Watt。; U* Q1 u* G6 w5 X) T! x
但硬件价格与毛利极高,从 TCO 角度,“谁买单 GPU 溢价”是关键——云厂商多半将成本转嫁给 API 用户。
( i2 {! i* `1 E6 U; e# }: U; h5.2 Google TPU 方案( H5 Z. b9 T# p3 @6 l8 I) x
CAPEX:
" x* x3 w- c8 d2 U
2 x% t8 M) \. `3 W8 F/ Z单 TPU v4 定价约 $3.22/芯片小时,v5/v6 在云端按实例小时定价对外[52][54]。3 V V$ d4 J. a" ]
GSR 估算:TPU 的出厂 ASP 约 $4,500–5,000/片(Google 内部成本)[54]。. d5 z2 \) o+ O6 d$ C$ `
8 TPU v5e 实例约 $11/h,而 8×H100 云价可高达该数值的 5–10 倍[52][54]。' Q% T2 ^5 y9 R& W* c; ?
能效:0 o0 [8 ~! y$ I" ?. ^. Q$ u
; E* |! a: [; W- }( ^
TPU v5e vs H100:
. m$ u0 D" T3 G0 F& I" v! `同级推理场景下,8×TPU v5e ≈ 2,175 tokens/s(Llama2‑70B,INT8)[67],H100 需更高功耗才能匹配。( r; ^# s0 R2 i: l
测试表明 v5e 功耗约为 H100 的 1/5 左右[67][52]。
0 \) r: Y& R/ l0 L* |6 Z4 g新一代 Trillium/TPU v7:
1 ^8 \) w M8 x$ l$ g, \5 Z能效比 TPU v5p 提升 ~67%,对 H200 或 B200 整体上能实现 2–3×性能/W 优势[52][65]。2 R" P8 n6 F7 N: O4 f
Google 方案的特点:6 _: I0 m1 E0 n( @
$ T' S$ m' l" q( |- X: m/ i6 Q自用闭环——Google Cloud + TPU + Gemini,利润来自整体云栈,而非单个芯片;
7 a" h; j/ u& d; O0 l+ T6 x2 Q对外公布的 API 价格较为激进,TPU 方案在 tokens/W 与 tokens/$ 上具有显著优势,尤其在内部工作负载。2 G" T1 e) _0 g9 w5 g
5.3 华为昇腾 910B / 910C 方案1 z7 k) w; t4 e1 G
CAPEX:
) f; v2 @9 Y @9 o6 y
$ V: D# o A/ c8 F" z2 P单 910B 芯片成本约 50,000 元人民币 ≈ $7k[60];910C 约 110,000 元[60]。
/ O2 c! p U- m, W5 {. x! h与 A100 对比:. O) c' C3 k9 S8 T
FP16 算力 320–376 TFLOPS,功耗 310W,性能接近甚至略高于 A100(400W)[80][81][82]。+ u5 _0 {, Z/ L! ?
市场报道中,NVIDIA H20 在中国售价约 10 万元/片,而 910B 更便宜 30–40%[61][72]。 V" V% i6 M- ]5 z5 n5 D# g' P. \
使用昇腾构建类似 400MW 级别集群,总 GPU CAPEX 相较 NVIDIA 可节省 30–60%,视集群规模与供货条件而定。1 ?6 X4 l# A, Y5 K8 D
OPEX & 能效:8 j9 G& v! H; T9 k0 x1 }
' m9 `& j5 ]3 f9 D
910B 功耗 310W,FP16 320–376 TFLOPS → 性能/W 与 A100/H20 接近或更优[80][81][82]。1 ^. n: E% U* ~1 t v5 p6 @* ?/ L
部分推理 benchmark 显示,长上下文(>4k token)推理时,910B 在 tokens-per-watt 上可超过 H200[71]。
: w1 R5 B$ T3 ~# X在中国电价(0.3–0.4 元/kWh)环境下,昇腾方案在 TCO/tokens 维度有明显优势,但生态与软件栈仍在追赶 CUDA。
* r8 K3 l( f6 C5.4 平头哥真武 810E(PPU)方案2 B( h% E8 \& e. U0 _+ a
CAPEX:% s/ K X m- s: C9 |; E6 o
1 n. d" o6 B! r3 _& R技术参数:+ h" l- g0 c* n& V" b
96GB HBM2e,片间互联带宽 700GB/s,自研 ICN 互联,PCIe 5.0 ×16,400W 功耗级别[59][102][111]。# H U+ r# r |5 u
性能:官方宣称整体性能超过 A800 与主流国产 GPU,与 NVIDIA H20 大致相当,升级代际可逼近/超过 A100[59][110]。" G6 M i4 j$ T; b& g6 \% q
价格:' D9 E& l$ E* [/ Z$ V2 T% c
未公开详细单价;多个媒体报道指出“单位算力成本可下降 ~40%”,与英伟达 H20 有 3–4 成价差[74][112]。
1 p' R4 E l/ q4 m+ N# k结合国内报道:
: W/ r4 c, r/ |' `7 h% }3 b7 O2025 年出货量数十万片,已在阿里云实现多个万卡集群部署,服务 400+ 客户[59][111]。: | n) @& g' y0 P7 }! T1 C
数量规模与生态成熟度迅速提升,使得 真武+昇腾 成为中国公有云/算力租赁的主力基础。
`- _) X) e2 e" yOPEX & 能效:5 Q8 o4 ^/ c0 Q; r2 @' Y( n
) m) L! S' W) b7 s" J8 N# y400W TDP、96GB HBM2e,使其在 高上下文、RAG、大模型训练+推理一体化场景 中具有良好性能/能效平衡;
5 C+ x& g/ ]5 @6 Q- B) L在中国低电价 + 低人工成本环境下,真武方案可将 AI 推理服务的综合 token 成本进一步压缩 —— 对标 NVIDIA H20,本地算力提供商可在保持 ~8–9 成性能的前提下降价 30–40% 仍保持毛利[74][112]。
4 `6 |1 e/ Q3 ]% y六、综合比较与策略建议
, C* w& c" r. X6 Y% ^6.1 区域维度:在哪里建 AI 数据中心?
8 M7 [* s0 f* A* X& r纯经济性(TCO/tokens)排序(假设无政策/合规约束):
. s1 w1 q6 W* D j, W2 Q2 u: t! T. ^' t5 y
中国西部/北部(电价低、人力低、建设成本低)
4 K. A$ a' [9 ^5 l中东(UAE/沙特)(电价中等偏低、土地与电力可得性好、政策支持)) P7 B) N( L+ R. a
美国电价低但人工高;东海岸/加州电价上涨压力大3 w2 }" m# C& L( R/ a+ p6 G" y
欧洲电价高、审批严格,但接近高价值企业客户和数据主权要求& j5 b4 p' j& N/ ]) a
若以“美国 $0.30/kWh vs 中国 0.3 元/kWh”极端场景比较:
* R/ ^+ _- q; V7 X- u7 I) n6 N
* p; _& X- [) X& o {) o( D! h纯电费/百万 token 差异:约 $0.083 vs $0.012 → 差别 ~$0.07/M tokens;8 ]- f' e! e1 x9 |$ _' k
对比 API 价格:差异对整体利润率的影响远小于是否使用 NVIDIA vs 国产芯片、自建 vs 云租的差异;
5 A* a) y, _! `* P6 }$ r4 y9 c但在极高利用率的 自建超级集群 场景,电价仍然能在 5 年 TCO 上带来 10–20% 的边际优化,是选址决策的重要考虑。
3 J/ D) M x8 W" F! Y6.2 技术栈维度:选哪家芯片/云栈?2 @' j7 `. y3 p. a7 d" m2 _
若目标是全球最优 tokens/$ 且不受出口管制:
. A+ b& w$ c( v. v. P9 k5 M/ s
( t5 Q8 q" M5 c# q$ l/ }. u) wGoogle TPU v7/Trillium + 自建 on-prem:性能/能效与成本的综合最优,但前提是可以直接获得 TPU 硬件与软件栈授权(现实中仅限 Google 内部和极少数大客户)。8 T! b" s( [7 b3 k% A- `: o
若在美国/欧洲,能自由采购 NVIDIA:- k! ?; s( c$ K4 d; C8 ~$ q
. K& a4 N j1 K1 Z9 S$ M1 |短中期内,NVIDIA B200/GB200 NVL72 仍是最佳实践:; c E- i, M7 I$ U3 l6 F
成熟的软件栈与生态,极高的 tokens/s/GPU;# p/ n: ~: o( x U
在云厂商/超大规模自建模式下,配合液冷与 PUE~1.1,可取得较低的 token 成本;
8 h: q) |1 v& s; k. Q但要谨慎评估 GPU CAPEX≈总投资 40% 的集中风险。
# k( w' M+ T! X/ R9 P若在中国或存在出口管制约束:
' R2 j) S2 T7 Q( Z+ ?/ a. X- O
+ G* X5 y9 y \' G) L1 o昇腾 910B/910C + 平头哥真武 810E 是现实可行的主力组合:
5 i! D, k( P6 C* `性能上已能覆盖大部分 GPT‑4 类推理需求;
; Q8 n9 j, R$ [+ a% r* M单片成本显著低于 H20/H100,集群 CAPEX 明显更友好;
, @ F0 ?# ]: w" L- h! B0 S7 t2 o软硬件全栈国产(CANN + MindSpore + 通义/Qwen 等),可避免制裁风险;
' G: q. c5 Z. _2 u, ?% I N% b建议配合:. Q+ Z5 n/ F' N- j9 r4 O, L5 o1 H
高效液冷(PUE~1.1)、* J1 X( a3 ^7 S+ N6 |
大 batch、路由(浅层任务走小模型/低成本芯片)、
4 W+ x2 u9 C) f) z; A l强量化(FP8/INT4)与分层缓存策略,进一步摊薄 token 成本。/ H9 L9 y% O7 g; e! r% j# M; o( r0 L
长远看,“tokens-per-watt / PCE” 取代单纯 PUE/FLOPS 成为核心 KPI:. w i1 ^+ i& V6 L# L3 Q2 W
4 X' a+ s+ h! a! p% {* N数据中心运营者应从“PUE 1.5→1.1”的设施思维,转向“每瓦输出多少有价值 token”的AI 工厂思维[29][118];
/ ?) R2 D6 t2 ^这意味着:+ W$ }7 a+ w& L& M# F- J& s9 v1 S
优先选择 更高 tokens/J 的芯片架构(例如 TPU v7、B200、后续国产芯片);
( o; O5 B& F( r+ Z5 N" t3 L4 B精细化调优 batch size、路由策略、CoT 深度,将“energy-per-token”作为最优先指标来优化[17][26]。
& j; R6 r, J* o' z$ j, v6.3 针对你关心的具体问题的简要回答
& z3 k4 f* t& u" j- ~# ~AI 数据中心建设 vs 运营成本的大体比例?+ A+ A- z6 X& G# a8 N) T5 l
, w* W8 s3 E) h, E' f在 5 年期 TCO 视角下,CAPEX(尤其 GPU)约占总成本 50–70%,运营成本(电力+冷却+人工+维护)约 30–50%。; ?, ^* |2 Q% i8 u/ r
其中 GPU 自身 CAPEX 占到总 CAPEX 的 30–40%[36]。
- O* M& F( m. ?中国、美国、欧洲、中东的成本结构区别?9 c" V k+ ? N! ?5 L
6 v( | B6 X" c& j建设期:' p0 @ W; r3 N6 x% k
中国/中东的壳体+机电成本明显低于美欧(约 5–7 vs 8–12 vs 10–11M $/MW)[1][2][20]。6 e) Z8 \: f: n6 v% v2 @
运营期:8 e0 B$ S, `2 Y4 T q
电价:中东 ≈ 中国西部 < 美国平均 < 欧洲% [+ H b# w" w6 Y
人工:中 国 ≪ 美 欧,中东居中。
3 q; m, { k& N4 E8 a! Y. T在美国 $0.3/kWh 与中国 0.3 元/kWh 下 token 成本与利润率?
; G$ k7 n/ n" P- N3 I: A4 U6 ^& v( |9 n, r6 r! A5 R( G
对于典型 1 J/token 推理负载:" l: F& Q' z+ G% q- u1 A5 H) R4 I
美国 $0.30/kWh:电费约 $0.083/M token
/ @4 X* `1 Y0 M$ b7 d8 T, a6 e中国 0.3 元/kWh:电费约 $0.012/M token+ E/ e: [& q. ]3 K8 M w4 Q. y
对比 OpenAI 等对外价格($0.6–168/M token),电费无论在中国还是美国都只是利润表里的“小头”,主导因素是 GPU TCO 和平台溢价。
( O$ B% L' ?: \" c! l; m不同技术方案(NVIDIA / Google / 昇腾 / 平头哥)的建设与运营成本谁更有利?
* r- T+ T1 P1 e, A! ~8 t$ h* n5 T6 F2 ]
在可获得 TPU 的前提下:Google TPU v7 在 tokens/W 和 tokens/$ 上最优;
7 I4 q& Z7 a, E9 J ]5 s全球通用方案:NVIDIA Blackwell 全家桶(B200/GB200)+ 液冷,但 CAPEX 巨大;9 h Q/ w1 O4 w4 b2 f: f2 R
中国/被管制市场:昇腾 + 真武 是当前最有经济性与可持续性的路线,综合来看能把 token 成本压到 NVIDIA 方案的 40–70%。 |
评分
-
查看全部评分
|