一度電煉出多少 Token？　AI 時代的能源戰爭正在改寫遊戲規則

Short Title

Private

Public

2026-03-29

日期：2026年3月23日　作者：Kila

【超級懶人包】

GPU 硬件折舊今天佔 AI 推理總成本的六至七成半，電力只佔一至兩成。但 GPU 成本每年下跌四成，電價在資料中心走廊卻在飆升。這條交叉曲線何時翻轉，至今沒有任何機構預測過。
中國旗艦模型的 token 定價比美國同級低三至十倍。MiniMax M2.5 是 OpenRouter 全球用量排名第一的模型，output 定價是 Claude Opus 4.6 的二十一分之一。開發者用腳投票，投的不是最強大腦，而是每一塊錢能煉出多少 token。
計入 PUE 後，中美最低成本地區的資料中心有效電價差距只有幾美仙。真正的差距不在電價本身，而在基建速度：中國建一條特高壓輸電線不到五年，美國一條跨州輸電線要十七年。
美國未來五年新增 245 GW 名義發電裝機，折算有效容量只有 28 GW。問題不是缺電，是缺「對的電」。併網排隊 2,600 GW，變壓器交期近三年。這是一場基建速度與 AI 需求之間的結構性賽跑。

Nvidia 創辦人黃仁勳在今年 GTC 大會上說了一句話：「資料中心是 AI 工廠，它把電力轉化為 token。」幾乎同一時間，OpenAI 的 Sam Altman 在 BlackRock 基建峰會上把 AI 描述為「一種公用事業，像電力和水一樣，人們會按錶計費」。電力設備巨頭 Schneider Electric 更進一步，正式提出用「tokens per watt」取代傳統的 PUE，作為衡量資料中心效率的新行業標準。

三個定義行業方向的人，同時把 token 和電力劃上等號。這不是巧合。

如果 token 真的要成為人類的基礎資源，那問題就變得非常簡單：誰能最低成本地「煉」token，誰就掌握下一個時代的定價權。而「煉」的成本，歸根究底取決於兩件事：晶片和電力。晶片的故事市場已經講了三年。這篇文章要講的是另一半：電力。

GPU 買得起，電供不起

拆解 AI 推理的成本結構，第一個反直覺的事實是：電力今天並不是大頭。

根據多個獨立來源的估算，在自營的超大規模 AI 資料中心中，GPU 硬件折舊佔推理總擁有成本（TCO）的 60% 至 75%，電力（包括冷卻）只佔 10% 至 20%。媒體經常引用的「電力佔資料中心成本四至六成」，指的是傳統資料中心的營運開支（OpEx），不包括硬件攤銷。一旦把每年數億美元的 GPU 更換成本計入分母，電力的比重就大幅縮水。

但這個比例正在逆轉。理解逆轉的邏輯，需要一個例子。

假設兩間公司使用同一款 GPU、同一個模型架構、同一套軟件堆疊。它們的 GPU 折舊成本完全一樣，人力成本大致相當，網絡和冷卻開支也差不多。唯一的差異是電價。在這個場景下，長期大規模推理的邊際成本差異，幾乎完全由電力決定。

隨着推理晶片走向專用化（Nvidia 的 ASIC 收購、Google TPU、各家自研晶片），硬件成本正在加速趨同。Nvidia Blackwell 架構每瓦 token 產出是上一代 Hopper 的十倍，下一代 Rubin 還要再翻十倍。GPU 效率每年提升約四成，推理成本在三年內已經下跌了大約一千倍。

電力呢？方向相反。美國最大區域電網 PJM 的容量拍賣價格在一年內暴漲了八倍。維珍尼亞州，全球最密集的資料中心走廊，正在立法強制大型資料中心簽訂十四年期的照付不議供電合約。微軟為了重啟三哩島核電廠取得專屬電力，付出了每兆瓦時 $115 的溢價，是一般工業電價的兩倍。

GPU 成本在跌，電價在升。這兩條曲線終會交叉。交叉之後，電力就不再是成本結構的配角，而是主角。至今沒有任何研究機構正式預測過這個交叉點何時到來。這本身就是一個市場尚未充分定價的盲點。

更麻煩的是傑文斯悖論（Jevons Paradox）。GPU 越高效，每個 token 越便宜，用量就越大。McKinsey 的分析直接警告：效率提升不會壓縮總電力需求，因為更便宜的推理會刺激指數級增長的使用量。煉油廠越高效，全球不會少用石油，只會用更多。Token 的邏輯一樣。

中美 Token 定價的十倍落差

OpenRouter 的 API 用量排名是 AI 模型競爭最誠實的計分板。2026 年 3 月，全球用量前三名全是中國模型：MiniMax M2.5（周耗 1.68 萬億 token）、StepFun 的 Step 3.5 Flash（1.33 萬億）、DeepSeek V3.2（1.06 萬億）。開發者用腳投票，投的不是最高智能指數，而是每一塊錢能煉出多少 token。

定價差距是數量級的。

Claude Opus 4.6 在 Artificial Analysis 的 Intelligence Index 得分 53，GPT-5.4 得 57.2。中國的 GLM-5 得 49.8，MiniMax M2.7 得 49.6。在 47 至 53 分這個區間，中美模型的能力差距已經相當有限，但 output 定價差距是四至二十一倍。

這個價差有七個疊加因素：MoE 架構效率（DeepSeek V3.2 有 6,710 億參數但每次只啟動 370 億）、虧損搶市定價、政府補貼、晶片制裁倒逼的軟件極限優化、電力成本、人力成本、開源策略。

電力在這七個因素中排第五。但它有一個其他因素都沒有的特性：隨規模放大，權重只會上升，不會下降。MoE 架構的效率增益有物理天花板。虧損定價不可能永續，智譜 AI 的港股 IPO 招股書顯示 2025 年上半年收入只有 $2,700 萬，虧損卻在加深。政府補貼受財政約束。晶片制裁下的軟件優化遲早會觸及硬件極限（DeepSeek 曾評估華為最先進的 Ascend 910C，認為仍不足以支撐下一代前沿模型的訓練）。

唯獨電力，只要推理規模繼續擴大，它在成本結構中的份量就會持續增加。這是物理定律，不是商業決策可以改變的。

美國的電力精煉廠，撞上了一面高牆

如果 token 的長期定價權最終取決於電力，那美國的處境就值得認真審視。

第一個出乎意料的發現：計入 PUE（電源使用效率）後，中美最低成本地區的電價差距遠沒有想像中大。Google 公開的全球資料中心平均 PUE 是 1.09，美國超大規模業者在俄勒岡、德州等低電價州的有效電價約 $0.06 至 $0.07/kWh。中國西部在「東數西算」政策和國產晶片補貼下的有效電價約 $0.057 至 $0.073/kWh。差距以美仙計，不是以倍數計。

但差距不在價格。差距在速度和規模。

美國電力系統的核心矛盾，用一組數字就能說清楚。基於 EIA、NERC 和美國能源部的規劃數據測算，2026 至 2030 年美國新增發電裝機容量為 337 GW，其中風光等間歇性電源佔了 257 GW（76%），天然氣只佔 80 GW。同期退役的幾乎全是高可靠基載電源，煤電 76 GW，氣電 13 GW。淨新增 245 GW 聽起來很多。但按有效容量系數折算（太陽能只有 10%，風電 40%，煤氣核水超過 80%），五年的有效淨新增容量只有約 28 GW。

245 GW 的帳面數字，28 GW 的實際容量。近九成的名義裝機增量，在電網最需要的峰值時刻，無法轉化為可靠的電力保障。風電、太陽能補的是「電量」，不是「容量」。所謂電量，是全年總共發了多少電；容量，是在任何指定時刻能穩定輸出多少電力。太陽能電場在夜晚和陰天輸出接近零，名義 1 GW 的裝機折算成全年隨時可用的有效容量，大概只有 100 至 200 MW。AI 資料中心是全年 8,000 小時以上滿載運行的剛性負荷，它需要的恰恰是「容量」。

這就是為什麼正如二月的渦輪機專題中所分析，燃氣渦輪機是這個十年內唯一能大規模、快速部署的 dispatchable 電源。科技巨頭已經在繞過電網自建電廠：Meta 的 Hyperion 園區部署了三台 H-class 渦輪機共 2.26 GW，Stargate 項目訂了 29 台渦輪機。它們付的電價高達 $175/MWh，是一般工業的兩倍。但對正在訓練萬億參數模型的公司來說，缺電延遲六個月的機會成本，遠比多付一倍電費來得致命。

除了發電端，還有三個物理瓶頸同時卡住了美國的電力擴張。第一是變壓器短缺：大型電力變壓器的交期已從疫情前的數個月拉長到 128 至 143 週（接近三年），價格自 2019 年暴漲超過七成，美國 80% 的供應依賴進口。第二是併網排隊：全美等待併網審批的發電和儲能項目容量達 2,600 GW，是現有電網總裝機的兩倍，中位數等待時間從 2008 年的不到兩年惡化到現在的近五年，80% 的項目最終因成本過高而撤回。第三是輸電網老化：70% 的輸電線路和變壓器服役超過 35 年，2024 年新增的高壓輸電線路只完成了規劃的兩成。

EPRI 在 2026 年 2 月的最新報告將美國資料中心到 2030 年的用電佔比預測上調至 9% 至 17%，比 2024 年的估算高出六成。但反面聲音同樣值得重視：南方環境法律中心委託的研究發現，美國東南部四個州的公用事業所預測的資料中心電力增長，實際發生的概率只有約 0.2%。部分公用事業（如 Georgia Power 的母公司 Southern Company）同時擁有發電廠和天然氣管道，有明確的經濟動機高估需求以獲取基建審批。與此同時，實際建設正在放緩：CBRE 數據顯示，美國主要市場在建資料中心容量從 2024 年底的 6.35 GW 跌至 2025 年底的 5.99 GW，是近年來首次下降。

預測在飆升，工地在停工。這個矛盾本身就是市場需要消化的信號。

煉鋁廠的教訓

如果覺得「電力成本重塑產業格局」聽起來太抽象，煉鋁業的歷史提供了一個殘酷的先例。

鋁冶煉是最接近 AI 推理的工業類比。電力佔煉鋁生產成本的 30% 至 50%，一座大型冶煉廠的年耗電量可達 11 TWh，足以供應一座中型城市。1970 年代以前，美國憑藉豐沛且廉價的水力發電主導全球鋁業。隨後，能源價格管制放寬導致電價飆升。結果是：美國從 33 家鋁冶煉廠縮減到今天的 4 家，產量從 465 萬噸跌至 68 萬噸，進口依存度從接近零升至近三分之二。產能轉移到了擁有廉價水力發電的加拿大和冰島（冰島 70% 至 80% 的發電量被煉鋁消耗），以及擁有廉價天然氣的中東。

AI 資料中心今天的電力成本佔比（10% 至 20%）遠低於煉鋁（30% 至 50%）。但 IEA 預測，到 2030 年，美國資料中心的用電量將超過鋁、鋼鐵、水泥、化工等所有傳統高耗能產業的總和。AI 已經在直接跟煉鋁廠搶電。微軟三哩島核電合約的 $115/MWh，遠超鋁冶煉廠的生存線 $40/MWh。鋁業協會（Aluminum Association）直接把資料中心的電力需求形容為「對電價不敏感的（price inelastic）」。

但 Sam Altman 自己說了：AI 的未來是公用事業。當 token 從「科技產品」變成「公用事業」，價格敏感度就會從零急速上升。到那一天，誰的電力精煉廠成本最低，誰就是贏家。

問題是，美國能在那一天到來之前解決它的基建瓶頸嗎？這是筆者接下來整個系列要追蹤的核心問題。下一篇，我們會拆解美國電力產業鏈的全景圖：從發電到輸電、從燃氣渦輪機到變壓器、從併網審批到 behind-the-meter，每一個環節的瓶頸在哪裏，誰在受益，誰在受困。

免責聲明

本文僅供資訊及教育用途，不構成任何投資建議或招攬。內容未考慮讀者之個人投資目標、財務狀況或需求。作者與本頻道並非持牌人士。所載資料來自被認為可靠之公開來源，但不保證其完整或準確。作者可能持有或不持有文中提及之證券。市場有風險，投資須審慎，讀者應自行判斷並在作出任何投資決定前諮詢持牌專業顧問。

投資理財

謎米財經分析報告

一度電煉出多少 Token？　AI 時代的能源戰爭正在改寫遊戲規則

【超級懶人包】

GPU 買得起，電供不起

中美 Token 定價的十倍落差

美國的電力精煉廠，撞上了一面高牆

煉鋁廠的教訓

About BYOS

BAYGO

BYOS Workshops

Our Services

一度電煉出多少 Token？ AI 時代的能源戰爭正在改寫遊戲規則

【超級懶人包】

GPU 買得起，電供不起

中美 Token 定價的十倍落差

美國的電力精煉廠，撞上了一面高牆

煉鋁廠的教訓

About BYOS

BAYGO

BYOS Workshops

Our Services

一度電煉出多少 Token？　AI 時代的能源戰爭正在改寫遊戲規則