DGX
基本信息
- 全称:NVIDIA DGX 系列(DGX-1 / DGX-2 / DGX A100 / DGX Station / DGX H100 / DGX SuperPOD / DGX Cloud / DGX GB200 / DGX Spark / DGX Station Ultra)
- 类型:自建业务(AI 整机系统)
- 创立时间:2016 年(DGX-1 发布)
- 首次提及:2021-04 GTC 2021 春 - AI Factory 概念
- 提及次数:18 篇素材中 15 篇明确出现
一句话定位
DGX 是 NVIDIA 把"AI 数据中心当成产品卖"的载体——从 2016 年第一台 DGX-1 被黄仁勋亲手送到 OpenAI,到今天 黄仁勋 反复强调的"DGX 超级计算机就是现代的 AI 工厂"。它的形态在一路演化:单机 → 整机柜 → SuperPOD → Cloud → 桌面级 DGX Spark;但核心从未变——"如果软件要由计算机来写,那么拥有最好软件工程师的公司,也必须拥有最好的计算机。"
发展历程
- 2016:DGX-1 发布。"我们意识到要做出一种全新的计算机——因为一种全新的软件开发方式出现了。软件将由软件来写,运行在 AI 计算机上。" 8 颗 GPU 第一次连在一起,170 teraflops。黄仁勋亲手把第一台 DGX-1 送到了一家叫 OpenAI 的旧金山初创公司——"那就是今天驱动 ChatGPT 的大语言模型背后的引擎"。(2024-03 GTC 2024 - Blackwell B200 发布、2023-03 GTC 2023 - AI 的 iPhone 时刻)
- 2021 年 4 月(GTC 2021 春):黄仁勋系统化介绍 DGX 系列:
- DGX A100:5 petaflops 计算单元
- DGX Station 320G:"一台装在盒子里的 AI 数据中心"——可以直接插进普通插座、4 颗 A100、320 GB HBM2e、8 TB/s 内存带宽、液冷到静音 37 分贝。售价 14.9 万美元——而一台同等性能的 CPU 集群要 100 万美元。
- DGX SuperPOD:完全集成、网络优化的 AI 数据中心,作为"产品"交付。起步 700 万美元,最大 6000 万美元。NVIDIA 自己的 Selene 就是四座 SuperPOD 组成的,是当时全球第五快的超级计算机、工业领域第一。(2021-04 GTC 2021 春 - AI Factory 概念)
- 2022 年 3 月(GTC 2022):DGX H100 发布。NVIDIA 自己用 576 台 DGX H100 / 4608 颗 H100 GPU 组成 "Eos" 超级计算机。(2022-03 GTC 2022 - Hopper H100 与 AI Factories)
- 2023 年 3 月(GTC 2023):发布 DGX Cloud——通过与 Microsoft Azure、Google Cloud、Oracle Cloud 合作,"把 NVIDIA DGX AI 超级计算机送到每一家公司、通过一个浏览器就能用"。同时把 DGX 重新定位为 "现代 AI 工厂":"财富 100 强里有一半都装了 DGX AI 超算。"(2023-03 GTC 2023 - AI 的 iPhone 时刻)
- 2023 Q1 财报:DGX Cloud 的理想比例是"10% NVIDIA DGX Cloud + 90% CSP 自己的云"——目的是"非常深地和 CSP 合作,共同打造最高性能的基础设施"。(2023-Q1 NVIDIA FY24 财报 - iPhone 时刻)
- 2024 年 3 月(GTC 2024):黄仁勋指着 GB200 NVL72 机柜:"这是一颗 DGX——六年前我能亲手把第一台 DGX-1 送到 OpenAI(0.17 petaflops)。现在这台是 720 petaflops,差不多是世界上第一台单机柜 exaflops 级训练机。" DGX 的形态从单机演进成整机柜。(2024-03 GTC 2024 - Blackwell B200 发布)
- 2025 年 1 月 CES:发布 Project DIGITS——把 Grace Blackwell (GB10) 缩进个人桌面。"未来,每一个软件工程师、每一个工程师、每一个创意艺术家——每一个把计算机当作工具的人,都会需要一台 AI 超级计算机。" 它的内部代号其实就是 "Project DIGITS = Deep Learning GPU Intelligence Training System",是 DGX 的精神后裔。(2025-01 CES 2025 - Project DIGITS 与 Cosmos)
- 2025 年 3 月(GTC 2025):发布 DGX Station 和 DGX Spark:"这就是 PC 该有的样子。20 petaflops、72 个 CPU 核心、chip-to-chip interface、HBM 内存,甚至还留了个 PCIe 插槽给 GeForce。这就是 AI 时代的计算机。"(2025-03 GTC 2025 - Blackwell Ultra 与 Vera Rubin)
黄仁勋对 DGX 的评价
"DGX 超级计算机,曾经是 AI 研究的仪器,现在正 24/7 地在全球的企业里运行,提炼数据、处理 AI。财富 100 强里有一半都装了 DGX AI 超算——DGX 超级计算机就是现代的 AI 工厂。"
——2023-03 GTC 2023 - AI 的 iPhone 时刻"如果软件要由计算机来写,那么拥有最好软件工程师的公司,也必须拥有最好的计算机。"
——2021-04 GTC 2021 春 - AI Factory 概念"我亲手把第一台 NVIDIA DGX AI 超级计算机送到 OpenAI——那就是今天驱动 ChatGPT 的大语言模型背后的引擎。"
——2023-03 GTC 2023 - AI 的 iPhone 时刻"这是一颗 DGX——六年前我能亲手把第一台 DGX-1 送到 OpenAI(0.17 petaflops)。现在这台是 720 petaflops,差不多是世界上第一台单机柜 exaflops 级训练机。"
——2024-03 GTC 2024 - Blackwell B200 发布"DGX Cloud 同时拥有 NVIDIA AI 的最佳能力和世界顶级云服务商的最佳能力。"
——2023-03 GTC 2023 - AI 的 iPhone 时刻
体现的核心概念
- AI 工厂 —— DGX 是这个隐喻的最经典物理载体
- 数据中心即计算机 —— DGX 把"一台超级计算机当成一个产品出货"
- 加速计算 —— DGX 是加速计算最直接的硬件包装
- Bet the Company —— 第一台 DGX-1 送给 OpenAI 是 NVIDIA 押注深度学习时代的象征性动作
关键数据
| 年份 | 数据点 | 出处 |
|---|---|---|
| 2016 | DGX-1 出货,170 teraflops,第一台送 OpenAI | 2024-03 GTC 2024 - Blackwell B200 发布 |
| 2021 | DGX Station 320G 售价 14.9 万美元(CPU 等效 100 万) | 2021-04 GTC 2021 春 - AI Factory 概念 |
| 2021 | DGX SuperPOD 起步 700 万、上限 6000 万美元 | 2021-04 GTC 2021 春 - AI Factory 概念 |
| 2022 | NVIDIA 自己的 Eos:576 DGX H100 / 4608 H100 | 2022-03 GTC 2022 - Hopper H100 与 AI Factories |
| 2023 | 财富 100 强一半装了 DGX | 2023-03 GTC 2023 - AI 的 iPhone 时刻 |
| 2023-03 | DGX Cloud 发布 | 2023-03 GTC 2023 - AI 的 iPhone 时刻 |
| 2024 | GB200 NVL72 = 720 petaflops 单机柜(DGX-1 的约 4000 倍) | 2024-03 GTC 2024 - Blackwell B200 发布 |
| 2025 | DGX Station / DGX Spark / Project DIGITS | 2025-03 GTC 2025 - Blackwell Ultra 与 Vera Rubin、2025-01 CES 2025 - Project DIGITS 与 Cosmos |
相关产品
- Hopper —— DGX H100
- Blackwell —— DGX GB200 / GB200 NVL72
- Vera Rubin —— 下一代 DGX 形态
- Grace CPU / Grace Hopper —— DGX 的 CPU 侧搭档
- NVLink —— DGX 内部互联的核心
- Project DIGITS —— DGX 精神的桌面化版本
- OpenAI —— 第一台 DGX-1 的接收者,也是 DGX Cloud 的最大客户之一