加速计算(Accelerated Computing)
概念解析
定义与起源
加速计算是 NVIDIA 自 1993 年成立以来的根技术哲学:用一颗专门为并行计算设计的处理器,配合一颗做顺序处理的 CPU,去解决"普通计算机解决不了"的问题。它是 黄仁勋 整个事业的元命题——所有 CUDA 平台、GPU、Hopper、Blackwell、AI 工厂 的故事都是从这一句话长出来的。
最完整的一次定义出现在 2025-10 GTC 2025 华盛顿:
"We made the observation that if we could create a processor that could take advantage of more and more transistors, applying parallel computing and adding it to a CPU that does sequential processing, we could extend the capability of computing well beyond its boundary."
"我们很早就观察到——如果让一颗处理器充分利用越来越多的晶体管、应用并行计算、并把它加到一颗做顺序处理的 CPU 上,我们就能把计算的能力延展到远远超出原来的边界。"
——2025-10 GTC 2025 华盛顿
核心要义
第一,加速计算是一个全栈问题,不是一颗芯片的问题。
黄仁勋 在 2023-Q1 NVIDIA FY24 财报 - iPhone 时刻 反复强调:
"Accelerated computing is a full stack challenge. You have to engineer all of the software, all the libraries, and all the algorithms, integrate them into and optimize the frameworks, optimize it for the architecture of not just one chip, but the architecture of an entire data center."
"加速计算是一个全栈问题。你必须把所有软件、库、算法全部自己做出来,还要为整个数据中心的架构做优化,而不只是单颗芯片。"
——2023-Q1 NVIDIA FY24 财报 - iPhone 时刻
NVIDIA 有 400+ 个加速库(2026-Q4 NVIDIA FY26 财报 时已经更多),这种工程量是已知最难的计算形式。
第二,加速计算是"一次一个领域"的长征。
"We had to reinvent algorithms, create new libraries, even rewrite entire applications. And that's why it's taken so long. We took almost 30 years to come to today, and we did this one domain at a time."
"你不能把一段顺序执行的 CPU 软件直接扔到 GPU 上,不然反而会更慢。你必须重新发明算法、创造新的库、重写整个应用——这就是为什么这件事花了这么长时间。我们花了将近三十年才走到今天,而且是一次一个领域地走过来的。"
——2025-10 GTC 2025 华盛顿
黄仁勋 把"一次一个领域"作为 NVIDIA 真正的宝藏:地震波处理 → CT 重建 → 分子动力学 → 粒子物理 → 流体力学 → 图像处理 → 深度学习。每攻下一个领域都要重写整套算法。
第三,加速计算的拐点在 2023 年到来——因为通用计算已死。
摩尔定律已死 是这个论断的硬约束。当 Dennard scaling 在 2010 年代停下来之后,CPU 的免费午餐结束了,加速计算成为唯一前进的路径。
"Accelerated computing has reached a tipping point. General purpose computing has run out of steam. We need another way of doing computing so that we can continue to scale, so that we can continue to drive down the cost of computing."
"加速计算已经到了临界点。通用计算已经没动力了——我们必须换一种方式做计算,才能继续扩展、继续把成本往下压。"
——2024-03 GTC 2024 - Blackwell B200 发布
实践应用
- 第一个应用:1993 年的 PC 3D 图形加速(GeForce)
- 2006 年:CUDA 平台 发布,加速计算成为通用编程模型
- 2012 年:AlexNet 让加速计算和 AI 第一次接触
- 2016 年:DGX-1 把加速计算变成"AI 计算机"
- 2023 年:ChatGPT 引爆需求,全球 1 万亿美元数据中心开始向加速计算迁移(2023-Q1 NVIDIA FY24 财报 - iPhone 时刻)
- 2024 年:Blackwell 把单机柜变成 720 petaflops 的 AI 工厂
- 2026 年:算力即收入(compute equals revenues),加速计算成为新工业革命的发动机(2026-Q4 NVIDIA FY26 财报)
常见误区
误区一:加速计算 = 用 GPU 替代 CPU。
错。加速计算是 GPU 加上 CPU,让 CPU 做它擅长的顺序处理,让 GPU 做并行加速——这是一种异构计算模型。
误区二:加速计算只适合 AI。
错。CUDA-X 库覆盖科学计算、计算光刻(cuLitho)、量子模拟(cuQuantum)、天气预测(Earth-2)、组合优化(cuOPT)、计算流体力学等几十个领域。AI 只是它的"杀手级应用",但不是全部。
误区三:买一颗加速器就完成了"迁移到加速计算"。
错。加速计算是全栈问题——从算法、库、框架、系统软件、网络到机柜结构都要重写。这是 Extreme Co-Design 的根本原因。
黄仁勋原话精选
"The warp drive engine is accelerated computing, and the energy source is AI."
"曲速引擎是加速计算,而能量源是 AI。"
——2023-03 GTC 2023 - AI 的 iPhone 时刻"Accelerated computing is the best way for you to reclaim power, the best way for you to achieve net zero. Together, we are helping the world do the impossible."
"加速计算是让你重获电力、实现 Net Zero 的最佳方式。我们一起,正在帮助这个世界做过去做不到的事。"
——2023-03 GTC 2023 - AI 的 iPhone 时刻"General purpose computing is over. The future is accelerated computing and AI computing."
"通用计算已死。未来是加速计算和 AI 计算。"
——2025-09 BG2 Pod - OpenAI 与算力未来
思想演变
- 1993 年:NVIDIA 创立,加速计算还只是"用一颗专用芯片做 PC 3D 图形"。
- 2006 年:CUDA 平台 让加速计算第一次成为"通用并行编程模型"。
- 2012-2016 年:AlexNet 之后,加速计算从科学计算长到深度学习。
- 2021 年:2021-04 GTC 2021 春 - AI Factory 概念 第一次把加速计算和"数据中心是新计算单元"放在一起讲。
- 2023 年:iPhone 时刻——加速计算从"NVIDIA 一家在喊"变成"全球数据中心都在迁移"。(2023-Q1 NVIDIA FY24 财报 - iPhone 时刻)
- 2025 年:推理时代 让加速计算的需求被"再次重估 100 倍"。(2025-03 GTC 2025 - Blackwell Ultra 与 Vera Rubin)
- 2026 年:算力即收入。加速计算彻底变成基础设施层。(2026-Q4 NVIDIA FY26 财报)
相关概念
- CUDA 平台 —— 加速计算的软件层;没有 CUDA 就没有加速计算的开发者生态
- 摩尔定律已死 —— 加速计算的"为什么必须存在"的硬约束
- Extreme Co-Design —— 加速计算到了机柜级、AI 工厂级的极致形态
- AI 工厂 —— 加速计算 + 生成式 AI 后形成的新基础设施类型
- 数据中心即计算机 —— 加速计算重新定义了"计算单元"的边界
- Token 经济 —— 加速计算时代的产能与收入的换算单位