纯技术科普 · 不喊单 · 不荐股 · 只算账

一度电，
能吐多少Token？

前几期算了租金账、回本账。这一期转到更底层的一笔——电费账。 AI 这门生意，正从"烧钱造脑"转向"烧电干活"：训练是一次性，推理却要天天烧电。那一度电到底能换多少 Token？电费在算力成本里占几成？为什么省电越来越难？用 6 张自制图表，把"插座到 Token"这条能量账摊开。

一度电产出

>1000万

个 Token（最优工况）

单 Token 能耗

0.3–1.5

焦耳 / Token

电费占成本

10–20%

大头是卡的折旧

行业 PUE

1.5–1.6

十年没怎么动

先接上一期

租金账算完了，这期算电费账

EP03 我们算"包租公"的回本账，里面有一笔成本叫电费，当时一带而过。这一期把它单拎出来：很多人以为 AI 最费的是钱，其实越往后，最绕不开的是电。训练只烧一次，推理要持续烧——这正是"能耗账"今天才变重要的原因。

🔁 三十秒回顾前几期

EP01：算力 = 电；一张 GPU = 一台发电机；Token = 出租车跳表。
EP02：Token 单价在塌、用量在飙，"量价剪刀差"撑起总需求。
EP03：供给端"包租公"的回本账、毛利账，电费是其中一块成本。
这一期 EP3.5：把"电费"这块放大——一度电吐多少 Token、电费占几成、为什么省电越来越难。

🧾 这一期只回答一个问题：从插座到 Token，这条能量账怎么算？把"每度电的产出""电费占比""能效天花板"摊开，你就能判断 AI 烧电到底烧在哪、还有多少省的空间——而不是被"AI 耗电吓人"或"AI 其实不费电"两种极端各带一波节奏。

一图看懂全文

先给你一个数：一度电，能吐上千万 Token

整篇文章的结论，藏在这张"漏斗"里。左边是1 度电（1 kWh），经过 GPU + 模型这台"绞肉机"，右边吐出来的是 token。最优条件下，一度电能产出超过 1000 万个 Token。

FIG.01插座 → Token · 能量放大器

一度电的产出（最优工况，示意）· 同样一度电，跑老卡还是新卡、大模型还是小模型，差出好几倍

一度电能吐多少 Token，其实跟电关系不大——关键看这度电，喂给了什么芯片、跑的是什么模型。

本期核心论点 · 01

💡 看懂这张图，全文就懂一半了。"一度电吐多少 Token"不是一个固定数，而是一台"能效机器"的产出——机器越先进（新卡、低精度、合适的模型），同样一度电吐的 Token 越多。下面三步拆开：先看每个 Token 的能量底价，再看电费在成本里占几成，最后看这台机器的能效天花板在哪。

单个 Token 的能量底价

一个 Token，大概值0.3 到 1.5 焦耳

把"一度电上千万 Token"反过来，就是单个 Token 的能耗。在 H100 这类主流卡上，生成一个 Token 大约消耗 0.3–1.5 焦耳；换算到一次完整对话，中位数约 0.31 瓦时（Wh）—— 不到点亮一盏 LED 灯泡几十秒的电。

FIG.02每 Token 能耗区间

每个 Token 约 0.3–1.5 焦耳，取决于模型大小、精度与负载 · 越大的模型、越高的精度，单 Token 越费电

⚠️ 一个必须标注的坑：网上流传的"AI 一次提问耗一瓶水/一度电"之类的吓人数字，很多是非生产环境的估算，往往把真实能耗高估了 4–20 倍。真按生产部署算，效率比大众印象好得多。科普的本分是给区间、标来源，而不是挑最吓人的那个数。

一个反直觉的事实

电费，其实只占一成到两成

很多人以为 AI 的成本大头是电费。算一笔账你会发现恰恰相反：在一台 H100 服务器的算力成本里， 电费只占 10%–20%，真正的大头是卡本身的采购与折旧，剩下水冷、网络、运维加起来也不多。

FIG.031 元算力成本的去向

算力成本结构（示意，非某一家精确数）· 电费占一到两成，卡的采购与折旧才是真正的大头

这就解释了一件事：为什么大家拼命压电费、找便宜电，却很少有人因为电价高就不建机房—— 因为电费不是这门生意的命门，卡的折旧才是（这正是 EP03 那条"折旧赛跑"）。电费是持续的、躲不掉的运营成本，省一点是一点；但决定回本的，仍是那张会快速贬值的卡。

不过电费有个特点：它是动态成本，没法"包月"兜住。海量并发一上来，电力和带宽开销直接顶上去—— 这也是为什么算力越来越倾向按 Token、按用量计费，而不是固定包月：因为底层的电，本来就是按用量烧的。

能效天花板

省电的便宜招式，快用光了

机房里的电，并非全进了 GPU。衡量"有多少电真的用在算上"的指标叫 PUE。全球数据中心平均 PUE 卡在 1.5–1.6 已经差不多十年——意思是每 1 度电用于计算，还要额外搭进去约 0.5–0.6 度用于散热、供电损耗等。便宜的省电招式（自然冷却之类）基本用完了。

FIG.04冷却方式 → PUE 阶梯

不同冷却方式的 PUE（示意）· 从风冷到浸没，省电空间一路收窄；行业正用"每瓦多少 Token"取代 PUE 当新标尺

Tokens per Watt · 每瓦 Token

新的能效标尺：不看省了多少电，看一瓦电产出多少智能

PUE 只管"机房有没有浪费电"，不管"这些电算出了多少东西"。所以 2026 年行业越来越用 "每瓦 Token（tokens per watt）"——同样一瓦电，谁吐的 Token 多谁就赢。它把芯片能效 + 机房能效 + 模型效率合成一个数，比单看 PUE 更贴近这门生意的本质。

💡 一句话理解：PUE 像"这栋楼的空调费占电费几成"，每瓦 Token 像"每一度电做出了多少件产品"。省电只是手段，用同样的电做出更多东西，才是真本事。

为什么能耗账今天才重要

AI 正从"烧钱造脑"，转向"烧电干活"

训练一个大模型，是一次性的巨额投入——像盖一座脑子，盖完就完了。但模型上线后，每一次提问、每一个智能体任务，都在持续烧电。当用户量起来， 推理这笔"持续的电费"会慢慢盖过训练那笔"一次性的钱"。

FIG.05训练(一次性) vs 推理(持续) · 累计能耗

训练 vs 推理的累计能耗（示意趋势）· 用户量越大、用得越久，推理这笔持续电费越占主导

训练的钱，花完就完了；推理的电，要天天交。谁能让每瓦电吐更多 Token，谁就能在这场持续的电费战里活得更久。

本期核心论点 · 02

这不是空谈：2026 年 3 月，中国日均 Token 调用量已达约 140 万亿次，比 2024 年初涨了一千多倍。每一次调用都在烧电，推理的电力压力已经超出云厂商的补贴上限——海外甚至出现 "企业开始按预算限量用 AI"的报道，因为账单涨得太快。

一张算力地图，就是一张电价地图

机房往哪建？哪儿电便宜往哪儿建

既然电是持续成本，省电费最直接的办法就是把机房建到电便宜的地方。不同电源的成本差很多：风电、光伏最便宜，天然气次之，核电单看建设成本最贵。

FIG.06电源度电成本对比

不同电源的成本对比（示意）· 谷歌、微软等都在长约绑定风/光/核电，把"便宜且稳定的电"提前锁住

电的需求有多猛？数据中心 + AI + 加密，2022 年约占全球用电的 2%，2026 年可能翻倍；像爱尔兰这样的小国，数据中心一项就可能吃掉全国 约三分之一的电。于是巨头一边把机房往电便宜、电网还有余量的地区迁，一边直接投资风电场、光伏、甚至核电厂来锁电。

这也是为什么"AI 算力"和"能源"越来越绑在一起：到 2030 年，数据中心相关资本开支可能高达数万亿美元，其中很大一块不是买卡，而是抢电、建电、锁电。算力的尽头，是电力。

顺着这个逻辑推到极致——既然要找"便宜、稳定、还不要水"的电，有人干脆想把机房搬出地球。 太空算力，是"选址 = 找便宜电"的终极一跳。

🛰

Orbital Data Center · 太空数据中心

选址的终极答案：把机房搬上太空

在合适的轨道上，太阳能板效率可达地面的约 8 倍、还能近乎不间断发电（不分昼夜、没有云雨、没有大气衰减）；散热也不靠水冷，直接向冰冷的太空辐射。一句话：地面拼命压的电费和水冷，在太空近乎"白送"——这是"找便宜电"能想到的极限。

这不是科幻：2025 年 11 月一周之内，英伟达把 H100 首次送上太空（比此前在轨算力强约 100 倍，还在轨跑通了大模型）；马斯克 SpaceX 宣布扩建星链做太空数据中心，目标 4–5 年内每年部署 100GW 算力，并申请最多 100 万颗轨道卫星；谷歌启动"捕日者计划"，拟 2027 年初发射搭载 TPU 的原型星。中国也规划在 700–800 公里晨昏轨道建超千兆瓦级太空数据中心。

💡 一句话理解：地面找便宜电，是"在城里挑租金低的地段"；太空算力，是"直接搬到太阳底下、还不用付水电"。同一道题——便宜电 + 散热——被搬到地球之外去解。

≈ 8×

合适轨道上
太阳能板效率
对比地面

100 GW

SpaceX 目标
每年太空算力
部署规模

700–800km

中国规划的
晨昏轨道
超千兆瓦数据中心

🛰 但别急着上头：太空算力还在最早期——发射成本、在轨散热的工程难度、辐射对芯片的损伤、维护与数据回传，都是没解完的难题。它指明的是"电与散热"这道题的终极方向，不代表明天就能商用。趋势要看，时间表要冷静。

算力的尽头是电力；而电力的尽头，可能在地球之外。

本期延伸 · 太空算力

冷静一下

缺电之外，还有一个更尴尬的浪费

聊能耗，大家都盯着"AI 太费电"。但有一个反方视角更值得记住：很多电，其实是被空转浪费掉的。

利用率黑洞：有机房运维团队反馈，企业 GPU 集群的实际平均利用率只有 5%–14%——卡买来了、电也在烧，但大部分时间在空转。比起"缺电"，"空转"是更隐蔽的浪费。
从缺卡到缺电的转折：过去的瓶颈是"买不到卡"，现在越来越多人发现瓶颈变成了"供不上电、散不掉热"——GPU 功率密度成了没人提前规划的新约束。
吓人数字要打折："一次提问耗一瓶水/一度电"这类传播，很多把能耗高估了 4–20 倍。科普别帮着放大焦虑，给区间、标来源才是负责任的算法。
能效进步会被用量吃掉：就算每个 Token 越来越省电，只要总调用量涨得更快（千倍增长），总耗电还是往上走——这就是"杰文斯悖论"：越省，可能用得越多。

⚠️ 本质提醒："AI 烧电"是真的，但别被两种极端各带一波——既不是"耗电怪兽要毁灭地球"，也不是"其实根本不费电"。真相是：单个 Token 在变省，总用量在猛涨，浪费主要发生在空转和散热上。看懂能耗账，比跟着喊"费电/不费电"有用得多。

一页速查

这一期，六个数记牢

🔌

一度电 > 1000 万 Token

最优工况下的产出，取决于芯片与模型，不取决于"电"。

⚡

0.3–1.5 焦耳 / Token

单个 Token 的能量底价，一次对话中位约 0.31 Wh。

🧾

电费占 10%–20%

算力成本大头是卡的采购与折旧，不是电费。

🌡️

PUE 1.5–1.6

十年没怎么动；液冷 1.1、浸没 1.03 才更省。

📈

每瓦 Token

取代 PUE 的新能效标尺：一瓦电产出多少智能。

🕳️

利用率 5%–14%

很多卡在空转——比缺电更隐蔽的浪费。

三个最容易想拧的问题

一度电到底能吐多少 Token，有没有准数？

没有唯一准数。最优工况下能超过 1000 万个，但它高度依赖三件事：用的什么卡（新卡比老卡省）、跑多大的模型（小模型更省）、什么精度（低精度更省）。所以"一度电吐多少 Token"本质是在问"这台能效机器有多先进"，而不是在问电。给区间、标条件，才是负责任的说法。

AI 是不是特别费电，会不会把电网烧穿？

要分两头看。单个 Token 的能耗在持续下降，网上很多"一次提问耗一瓶水"的数字被高估了 4–20 倍；但总调用量涨得更快（中国日均已达约 140 万亿次），所以总耗电仍在上升。压力确实存在，但主要矛盾是局部地区电网供给和散热，以及大量卡在空转的浪费——不是"单次提问太费电"。

这期讲的电，跟前几期的算力、租金是什么关系？

是同一笔账的不同层。EP01 说算力像电；EP02 说 Token 量价；EP03 算包租公的回本，电费是其中一块成本；这一期 EP3.5 把电费单独放大——它是推理时代躲不掉的持续运营成本。一句话串起来：电变成算力，算力吐出 Token，Token 换成收入，而电费就是这条链最底层、最持续的那笔开销。

本期数据来源（公开报道与研究，建议自行复核）

每 Token 能耗（0.3–1.5 焦耳）、一次查询中位约 0.31 Wh、最优工况每 kWh 超 1000 万 Token、公开估算常高估 4–20 倍：ScienceDirect《Energy use of AI inference》、Uptime Institute《The problem with energy per token》
数据中心 PUE（全球均值 1.5–1.6、风冷 1.3–1.5 / 液冷 1.1–1.2 / 浸没 1.03–1.05、德国 2026 强制 ≤1.2）、"每瓦 Token"新标尺：SemiEngineering、Spheron《AI Inference Power & Electricity Cost 2026》
电费占算力成本 10%–20%、H100 云租约 $2.5–3.5/hr、"一度电出多少 Token 取决于芯片架构"、推理为持续运营支出、中国日均 Token 调用约 140 万亿次、"烧钱造脑→烧电干活"：新华网、东方财富
电源度电成本（风电 $25 / 光伏 $26 / 天然气 $37 每 MWh、核电 capex 5–10×）、数据中心用电占比与选址、2030 年数万亿美元资本开支：Goldman Sachs、IAEA、Morgan Stanley 公开研究
企业 GPU 集群实际利用率仅 5%–14%、从缺卡到缺电的功率密度约束：r/datacenter 运维讨论（2026-06）、行业报道汇总
太空算力（轨道太阳能约 8× 且近乎不间断、英伟达 H100 入轨并在轨跑通大模型、SpaceX 目标年部署 100GW 与申请百万卫星、谷歌"捕日者计划"、中国 700–800km 晨昏轨道千兆瓦规划，时间窗 2025-11 至 2026-02）：CNBC、新华网、财联社等公开报道

📘 本文为 AI 技术与产业科普，目的是把"一度电能产出多少 Token、电费在算力成本里的占比、PUE 与能效、推理为何持续烧电"这些概念讲清楚。文中数据系引用公开报道与研究（来源见上），多为区间或示意，可能存在简化或偏差，欢迎指正。涉及能耗的具体数字随芯片、模型、工况差异很大，请勿当作精确测算。本内容仅为 AI 工具与术语科普，不构成任何投资建议。

一度电，能吐多少Token？

租金账算完了，这期算电费账

🔁 三十秒回顾前几期

先给你一个数：一度电，能吐上千万 Token

一个 Token，大概值0.3 到 1.5 焦耳

电费，其实只占一成到两成

省电的便宜招式，快用光了

新的能效标尺：不看省了多少电，看一瓦电产出多少智能

AI 正从"烧钱造脑"，转向"烧电干活"

机房往哪建？哪儿电便宜往哪儿建

选址的终极答案：把机房搬上太空

缺电之外，还有一个更尴尬的浪费

这一期，六个数记牢

三个最容易想拧的问题

一度电，
能吐多少Token？