一度电,
能吐多少Token?
前几期算了租金账、回本账。这一期转到更底层的一笔——电费账。 AI 这门生意,正从"烧钱造脑"转向"烧电干活":训练是一次性,推理却要天天烧电。 那一度电到底能换多少 Token?电费在算力成本里占几成?为什么省电越来越难? 用 6 张自制图表,把"插座到 Token"这条能量账摊开。
租金账算完了,这期算电费账
EP03 我们算"包租公"的回本账,里面有一笔成本叫电费,当时一带而过。 这一期把它单拎出来:很多人以为 AI 最费的是钱,其实越往后,最绕不开的是电。 训练只烧一次,推理要持续烧——这正是"能耗账"今天才变重要的原因。
🔁 三十秒回顾前几期
- EP01:算力 = 电;一张 GPU = 一台发电机;Token = 出租车跳表。
- EP02:Token 单价在塌、用量在飙,"量价剪刀差"撑起总需求。
- EP03:供给端"包租公"的回本账、毛利账,电费是其中一块成本。
- 这一期 EP3.5:把"电费"这块放大——一度电吐多少 Token、电费占几成、为什么省电越来越难。
🧾 这一期只回答一个问题:从插座到 Token,这条能量账怎么算?把"每度电的产出""电费占比""能效天花板"摊开,你就能判断 AI 烧电到底烧在哪、还有多少省的空间——而不是被"AI 耗电吓人"或"AI 其实不费电"两种极端各带一波节奏。
先给你一个数:一度电,能吐上千万 Token
整篇文章的结论,藏在这张"漏斗"里。左边是1 度电(1 kWh),经过 GPU + 模型这台"绞肉机", 右边吐出来的是 token。最优条件下,一度电能产出超过 1000 万个 Token。
一度电能吐多少 Token,其实跟电关系不大——关键看这度电,喂给了什么芯片、跑的是什么模型。
💡 看懂这张图,全文就懂一半了。"一度电吐多少 Token"不是一个固定数,而是一台"能效机器"的产出——机器越先进(新卡、低精度、合适的模型),同样一度电吐的 Token 越多。下面三步拆开:先看每个 Token 的能量底价,再看电费在成本里占几成,最后看这台机器的能效天花板在哪。
一个 Token,大概值0.3 到 1.5 焦耳
把"一度电上千万 Token"反过来,就是单个 Token 的能耗。在 H100 这类主流卡上, 生成一个 Token 大约消耗 0.3–1.5 焦耳;换算到一次完整对话,中位数约 0.31 瓦时(Wh)—— 不到点亮一盏 LED 灯泡几十秒的电。
⚠️ 一个必须标注的坑:网上流传的"AI 一次提问耗一瓶水/一度电"之类的吓人数字,很多是非生产环境的估算,往往把真实能耗高估了 4–20 倍。真按生产部署算,效率比大众印象好得多。科普的本分是给区间、标来源,而不是挑最吓人的那个数。
电费,其实只占一成到两成
很多人以为 AI 的成本大头是电费。算一笔账你会发现恰恰相反:在一台 H100 服务器的算力成本里, 电费只占 10%–20%,真正的大头是卡本身的采购与折旧,剩下水冷、网络、运维加起来也不多。
这就解释了一件事:为什么大家拼命压电费、找便宜电,却很少有人因为电价高就不建机房—— 因为电费不是这门生意的命门,卡的折旧才是(这正是 EP03 那条"折旧赛跑")。 电费是持续的、躲不掉的运营成本,省一点是一点;但决定回本的,仍是那张会快速贬值的卡。
不过电费有个特点:它是动态成本,没法"包月"兜住。海量并发一上来,电力和带宽开销直接顶上去—— 这也是为什么算力越来越倾向按 Token、按用量计费,而不是固定包月:因为底层的电,本来就是按用量烧的。
省电的便宜招式,快用光了
机房里的电,并非全进了 GPU。衡量"有多少电真的用在算上"的指标叫 PUE。 全球数据中心平均 PUE 卡在 1.5–1.6 已经差不多十年——意思是每 1 度电用于计算, 还要额外搭进去约 0.5–0.6 度用于散热、供电损耗等。便宜的省电招式(自然冷却之类)基本用完了。
新的能效标尺:不看省了多少电,看一瓦电产出多少智能
PUE 只管"机房有没有浪费电",不管"这些电算出了多少东西"。所以 2026 年行业越来越用 "每瓦 Token(tokens per watt)"——同样一瓦电,谁吐的 Token 多谁就赢。 它把芯片能效 + 机房能效 + 模型效率合成一个数,比单看 PUE 更贴近这门生意的本质。
💡 一句话理解:PUE 像"这栋楼的空调费占电费几成",每瓦 Token 像"每一度电做出了多少件产品"。省电只是手段,用同样的电做出更多东西,才是真本事。
AI 正从"烧钱造脑",转向"烧电干活"
训练一个大模型,是一次性的巨额投入——像盖一座脑子,盖完就完了。但模型上线后, 每一次提问、每一个智能体任务,都在持续烧电。当用户量起来, 推理这笔"持续的电费"会慢慢盖过训练那笔"一次性的钱"。
训练的钱,花完就完了;推理的电,要天天交。谁能让每瓦电吐更多 Token,谁就能在这场持续的电费战里活得更久。
这不是空谈:2026 年 3 月,中国日均 Token 调用量已达约 140 万亿次,比 2024 年初涨了一千多倍。 每一次调用都在烧电,推理的电力压力已经超出云厂商的补贴上限——海外甚至出现 "企业开始按预算限量用 AI"的报道,因为账单涨得太快。
机房往哪建?哪儿电便宜往哪儿建
既然电是持续成本,省电费最直接的办法就是把机房建到电便宜的地方。 不同电源的成本差很多:风电、光伏最便宜,天然气次之,核电单看建设成本最贵。
电的需求有多猛?数据中心 + AI + 加密,2022 年约占全球用电的 2%,2026 年可能翻倍; 像爱尔兰这样的小国,数据中心一项就可能吃掉全国 约三分之一的电。 于是巨头一边把机房往电便宜、电网还有余量的地区迁,一边直接投资风电场、光伏、甚至核电厂来锁电。
这也是为什么"AI 算力"和"能源"越来越绑在一起:到 2030 年,数据中心相关资本开支可能高达数万亿美元, 其中很大一块不是买卡,而是抢电、建电、锁电。算力的尽头,是电力。
顺着这个逻辑推到极致——既然要找"便宜、稳定、还不要水"的电,有人干脆想把机房搬出地球。 太空算力,是"选址 = 找便宜电"的终极一跳。
选址的终极答案:把机房搬上太空
在合适的轨道上,太阳能板效率可达地面的约 8 倍、还能近乎不间断发电(不分昼夜、没有云雨、没有大气衰减); 散热也不靠水冷,直接向冰冷的太空辐射。一句话:地面拼命压的电费和水冷,在太空近乎"白送"——这是"找便宜电"能想到的极限。
这不是科幻:2025 年 11 月一周之内,英伟达把 H100 首次送上太空(比此前在轨算力强约 100 倍,还在轨跑通了大模型); 马斯克 SpaceX 宣布扩建星链做太空数据中心,目标 4–5 年内每年部署 100GW 算力,并申请最多 100 万颗轨道卫星; 谷歌启动"捕日者计划",拟 2027 年初发射搭载 TPU 的原型星。中国也规划在 700–800 公里晨昏轨道建超千兆瓦级太空数据中心。
💡 一句话理解:地面找便宜电,是"在城里挑租金低的地段";太空算力,是"直接搬到太阳底下、还不用付水电"。同一道题——便宜电 + 散热——被搬到地球之外去解。
太阳能板效率
对比地面
每年太空算力
部署规模
晨昏轨道
超千兆瓦数据中心
🛰 但别急着上头:太空算力还在最早期——发射成本、在轨散热的工程难度、辐射对芯片的损伤、维护与数据回传,都是没解完的难题。它指明的是"电与散热"这道题的终极方向,不代表明天就能商用。趋势要看,时间表要冷静。
算力的尽头是电力;而电力的尽头,可能在地球之外。
缺电之外,还有一个更尴尬的浪费
聊能耗,大家都盯着"AI 太费电"。但有一个反方视角更值得记住:很多电,其实是被空转浪费掉的。
- 利用率黑洞:有机房运维团队反馈,企业 GPU 集群的实际平均利用率只有 5%–14%——卡买来了、电也在烧,但大部分时间在空转。比起"缺电","空转"是更隐蔽的浪费。
- 从缺卡到缺电的转折:过去的瓶颈是"买不到卡",现在越来越多人发现瓶颈变成了"供不上电、散不掉热"——GPU 功率密度成了没人提前规划的新约束。
- 吓人数字要打折:"一次提问耗一瓶水/一度电"这类传播,很多把能耗高估了 4–20 倍。科普别帮着放大焦虑,给区间、标来源才是负责任的算法。
- 能效进步会被用量吃掉:就算每个 Token 越来越省电,只要总调用量涨得更快(千倍增长),总耗电还是往上走——这就是"杰文斯悖论":越省,可能用得越多。
⚠️ 本质提醒:"AI 烧电"是真的,但别被两种极端各带一波——既不是"耗电怪兽要毁灭地球",也不是"其实根本不费电"。真相是:单个 Token 在变省,总用量在猛涨,浪费主要发生在空转和散热上。看懂能耗账,比跟着喊"费电/不费电"有用得多。
这一期,六个数记牢
三个最容易想拧的问题
- 每 Token 能耗(0.3–1.5 焦耳)、一次查询中位约 0.31 Wh、最优工况每 kWh 超 1000 万 Token、公开估算常高估 4–20 倍:ScienceDirect《Energy use of AI inference》、Uptime Institute《The problem with energy per token》
- 数据中心 PUE(全球均值 1.5–1.6、风冷 1.3–1.5 / 液冷 1.1–1.2 / 浸没 1.03–1.05、德国 2026 强制 ≤1.2)、"每瓦 Token"新标尺:SemiEngineering、Spheron《AI Inference Power & Electricity Cost 2026》
- 电费占算力成本 10%–20%、H100 云租约 $2.5–3.5/hr、"一度电出多少 Token 取决于芯片架构"、推理为持续运营支出、中国日均 Token 调用约 140 万亿次、"烧钱造脑→烧电干活":新华网、东方财富
- 电源度电成本(风电 $25 / 光伏 $26 / 天然气 $37 每 MWh、核电 capex 5–10×)、数据中心用电占比与选址、2030 年数万亿美元资本开支:Goldman Sachs、IAEA、Morgan Stanley 公开研究
- 企业 GPU 集群实际利用率仅 5%–14%、从缺卡到缺电的功率密度约束:r/datacenter 运维讨论(2026-06)、行业报道汇总
- 太空算力(轨道太阳能约 8× 且近乎不间断、英伟达 H100 入轨并在轨跑通大模型、SpaceX 目标年部署 100GW 与申请百万卫星、谷歌"捕日者计划"、中国 700–800km 晨昏轨道千兆瓦规划,时间窗 2025-11 至 2026-02):CNBC、新华网、财联社 等公开报道