Blackwell
基本信息
- 全称:NVIDIA Blackwell 架构(B100 / B200 / GB200 / GB200 NVL72 / Blackwell Ultra)
- 类型:自建业务(数据中心 GPU 代际)
- 命名:纪念数学家、统计学家 David Blackwell
- 代际位置:Hopper (2022/2023) → Blackwell (2024) → Vera Rubin (2025-2026)
- 首次提及:2024-03 GTC 2024 - Blackwell B200 发布
- 提及次数:18 篇素材中 12 篇明确出现
一句话定位
Blackwell 不是一颗芯片,是一个平台的名字——它的最小有意义单位不是 GPU、不是服务器,而是 GB200 NVL72 整机柜:3000 磅、60 万个零件、1 exaflops 训练算力、铜线 NVLink 互联、液冷。Blackwell 是 NVIDIA 把"数据中心即计算机"这个判断推到极致的产品形态。
发展历程
- 2024 年 3 月(GTC 2024):B200 发布。"请欢迎一颗非常非常大的 GPU——"黄仁勋拿起 Blackwell 实物。"Blackwell 不是一颗芯片。Blackwell 是一个平台的名字。"
- 208 亿晶体管,第一次两颗 die 通过 10 TB/s die-to-die 带宽连成一颗 GPU
- 第二代 Transformer Engine:FP8 → FP6 → FP4 动态精度
- 第五代 NVLink:双向 1.8 TB/s
- NVLink Switch:500 亿晶体管的连接器,让每颗 GPU 满带宽和每颗其他 GPU 通信
- GB200 NVL72 整机柜:720 petaflops、3000 磅、5000 根 NVLink 线(共 2 英里长)、60 万个零件、液冷("差不多一辆碳纤维法拉利的重量")
- 训练 1.8T GPT:从 Hopper 的 8000 GPU/15 MW 降到 2000 GPU / 4 MW。(2024-03 GTC 2024 - Blackwell B200 发布)
- 2025 Q4 财报(FY25 Q4):单季 Blackwell 营收 110 亿美元,"NVIDIA 史上最快的产品爬坡"。"我们有大约 350 家工厂在制造每一台 Blackwell 整机柜里的 150 万个零件。"(2025-Q4 NVIDIA FY25 财报 - Blackwell ramp)
- 2025 年 3 月(GTC 2025):黄仁勋搬出整柜液冷的 GB200 NVL72,讲清楚 NVIDIA 为什么要把整机柜当成一颗芯片卖。"我们真正想造的是这颗芯片——130 万亿晶体管,其中 20 万亿用于计算。但没有哪条 reticle 极限、哪个工艺节点能做出这颗芯片。所以我们把它 disaggregate 成 Grace Blackwell NVLink72 机柜。这是人类做过的最极致的 scale up。" 在 reasoning 工作负载下 Blackwell 是 Hopper 的 40 倍。(2025-03 GTC 2025 - Blackwell Ultra 与 Vera Rubin)
- 2025 年下半年:Blackwell Ultra NVLink72 出货——FLOPS +1.5 倍、内存 +1.5 倍、网络带宽翻倍,同架构平滑升级。(2025-03 GTC 2025 - Blackwell Ultra 与 Vera Rubin)
- 2025 年 9 月 BG2 Pod:黄仁勋反复强调"Blackwell 是 Hopper 的 30 倍"——这个数字不是来自摩尔定律,而是因为 NVIDIA 同时重做了 CPU、GPU、网络芯片、NVLink scale-up、Spectrum-X scale-out、冷却、电源、机架。(2025-09 BG2 Pod - OpenAI 与算力未来)
- 2025 年 1 月 CES:消费级也有了——GeForce RTX 50 系列(Blackwell 架构)。RTX 5090 920 亿晶体管,3352 TOPS AI 算力。(2025-01 CES 2025 - Project DIGITS 与 Cosmos)
- 2026 Q4 财报(FY26 Q4):Meta 宣布将部署"数百万张 Blackwell 和 Rubin GPU"。和 Anthropic 合作训练在 Grace Blackwell 和 Vera Rubin 系统上。(2026-Q4 NVIDIA FY26 财报)
黄仁勋对 Blackwell 的评价
"Blackwell 不是一颗芯片。Blackwell 是一个平台的名字。人们以为我们造 GPU——没错我们是——但 GPU 已经不是它过去的样子了。"
——2024-03 GTC 2024 - Blackwell B200 发布"10 TB/s 的 die-to-die 带宽,让 Blackwell 芯片的两侧根本不知道自己在哪一侧。没有内存局部性问题,没有缓存问题。它就是一颗巨型芯片。当我们告诉工程师 Blackwell 的野心超出了物理极限时,工程师说 'so what?'——然后就做出来了。"
——2024-03 GTC 2024 - Blackwell B200 发布"When somebody asks me what does a GPU look like? I see this."(指着 GB200 NVL72 机柜)"This is what a GPU looks like to me."
——2024-03 GTC 2024 - Blackwell B200 发布"Blackwell 是 Hopper 的 30 倍。No Moore's law could possibly achieve that. That's because NVIDIA got into networking and switching and scale up and scale out and scale across, building CPUs and building GPUs and building NICs."
——2025-09 BG2 Pod - OpenAI 与算力未来"我们设计 Blackwell 的时候就是冲着 reasoning 模型去的。在长思考的 test-time scaling 场景下,Blackwell 比 Hopper 快几十倍、吞吐高 25 倍。"
——2025-Q4 NVIDIA FY25 财报 - Blackwell ramp"我们真正想造的是这颗芯片——130 万亿晶体管,其中 20 万亿用于计算。但没有哪条 reticle 极限、哪个工艺节点能做出这颗芯片。所以我们把它 disaggregate 成 Grace Blackwell NVLink72 机柜。这是人类做过的最极致的 scale up。"
——2025-03 GTC 2025 - Blackwell Ultra 与 Vera Rubin
体现的核心概念
- 数据中心即计算机 —— "芯片不是产品,机柜才是产品,AI 工厂才是产品"
- Scale Up 与 Scale Out —— GB200 NVL72 是"人类做过最极致的 scale up"
- Extreme Co-Design —— Blackwell 30x Hopper 的来源:"我们同时重做了 CPU、GPU、网络芯片、NVLink、Spectrum-X、冷却、电源、机架"
- 推理时代 —— "我们设计 Blackwell 的时候就是冲着 reasoning 模型去的"
- Token 经济 —— Blackwell 的 perf-per-watt 直接换算成客户的收入
关键数据
| 年份 | 数据点 | 出处 |
|---|---|---|
| 2024-03 | B200 发布,208 亿晶体管,两 die 合一 | 2024-03 GTC 2024 - Blackwell B200 发布 |
| 2024-03 | GB200 NVL72:720 petaflops、3000 磅、60 万零件、5000 根 NVLink 线 | 2024-03 GTC 2024 - Blackwell B200 发布 |
| 2024-03 | 训练 1.8T GPT:2000 GPU、4 MW、90 天(Hopper 8000/15MW) | 2024-03 GTC 2024 - Blackwell B200 发布 |
| 2025 Q4 FY25 | 单季 Blackwell 营收 110 亿美元 | 2025-Q4 NVIDIA FY25 财报 - Blackwell ramp |
| 2025 Q4 FY25 | 350 家工厂、150 万个零件/机柜 | 2025-Q4 NVIDIA FY25 财报 - Blackwell ramp |
| 2025-03 | reasoning 工作负载下比 Hopper 快 40 倍 | 2025-03 GTC 2025 - Blackwell Ultra 与 Vera Rubin |
| 2025-03 | Blackwell Ultra NVLink72 下半年出货 | 2025-03 GTC 2025 - Blackwell Ultra 与 Vera Rubin |
| 2025-09 | "Blackwell 是 Hopper 的 30 倍" | 2025-09 BG2 Pod - OpenAI 与算力未来 |
| 2026 | Meta 部署"数百万张" Blackwell 和 Rubin | 2026-Q4 NVIDIA FY26 财报 |
相关产品
- Hopper —— 上一代,Blackwell 在 reasoning 下是它的 30-40 倍
- Vera Rubin —— 下一代
- NVLink —— Blackwell 的灵魂;NVLink Switch 是 500 亿晶体管的连接器
- Grace CPU —— Grace Blackwell (GB200) 是 Grace + Blackwell 超级芯片
- GeForce —— RTX 50 系列把 Blackwell 架构带到消费级
- DGX —— DGX GB200 是 Blackwell 时代的整机柜旗舰
- Project DIGITS —— GB10 是把 Grace Blackwell 缩到桌面的版本
- NIM / Cosmos —— Blackwell 之上的软件栈