NIM
基本信息
- 全称:NVIDIA Inference Microservices
- 类型:自建业务(AI 模型分发与部署)
- 首次提及:2024-03 GTC 2024 - Blackwell B200 发布
- 提及次数:3 篇素材中明确出现
一句话定位
NIM 是 NVIDIA 在 Blackwell 时代给出的"AI 时代的软件分发单位"——把每一个预训练模型打包成可在 NVIDIA 任何硬件上即装即跑的微服务,让企业可以像组装乐高一样把多个 NIM 拼成 agent 团队。"NeMo + NIM + DGX Cloud"是 NVIDIA 的三层 AI Foundry 栈。
发展历程
- 2024 年 3 月(GTC 2024):NIM 在 GTC 2024 上正式发布。"既然我们造了一台生成式 AI 时代的计算机,那么生成式 AI 时代的软件长什么样?" 答案是 NIM——"一个 NIM 就是一个预训练模型,已经打包好、已经优化好,可以在 NVIDIA 的所有硬件上跑。你去 ai.nvidia.com 就能下载。" 黄仁勋演示了"一个聊天机器人本身是 NIM,调用懂 SAP 的 NIM、懂 ServiceNow 的 NIM、懂组合优化的 NIM"——多 agent 协作的雏形。同时把 NIM 放进"三根支柱"叙事:NIM(模型)+ NeMo Microservices(修改模型的工具)+ DGX Cloud(基础设施)。"我们本质上是一家 AI Foundry。"(2024-03 GTC 2024 - Blackwell B200 发布)
- 2025 年 1 月 CES:发布 Llama Nemotron——"一套用于企业生成式 AI 的增强模型,以 NIM 微服务形式交付,可以在任何加速系统上加速 AI agent。"NIM 与 CrewAI、Daily、LangChain、LlamaIndex、Weights & Biases 等主流 agent 框架配合。同时发布 PDF-to-podcast、视频搜索摘要等 AI Blueprints。(2025-01 CES 2025 - Project DIGITS 与 Cosmos)
- NeMo Retriever:在 GTC 2024 上同步发布,作为把企业向量数据库变成"可对话知识库"的 NIM 配套组件——"我们的软件团队现在每天就跟 bug 数据库聊天:'昨晚有多少个 bug?我们有进展吗?'"(2024-03 GTC 2024 - Blackwell B200 发布)
黄仁勋对 NIM 的评价
"一个 NIM 就是一个预训练模型,已经打包好、已经优化好,可以在 NVIDIA 的所有硬件上跑。你去 ai.nvidia.com 就能下载。"
——2024-03 GTC 2024 - Blackwell B200 发布"想象一下,某一天你用一个聊天机器人——它本身就是一个 NIM。它的一部分执行计划可能被交给另一个 NIM:比方说一个懂 SAP 和 ABAP 的 NIM、一个懂 ServiceNow 的 NIM;再交给另一个 NIM 去做组合优化计算。所有这些 NIM 拼在一起像一个团队一样协作,做惊人的事情。"
——2024-03 GTC 2024 - Blackwell B200 发布"这里正在浮现三根支柱。第一根是发明 AI 模型技术,并且替你把它打包好——这就是 NIM。第二根是帮你修改它的工具——这就是 NeMo Microservices。第三根是帮你微调和部署的基础设施——这就是 DGX Cloud。我们本质上是一家 AI Foundry。"
——2024-03 GTC 2024 - Blackwell B200 发布
体现的核心概念
- 一切皆软件 —— NIM 是这个理念的最直接产品化
- 加速计算 —— NIM 把模型预绑定到 NVIDIA 加速栈
- 多 agent 协作 —— NIM 是 agentic AI 时代的乐高积木
- AI Foundry —— NVIDIA 类比 TSMC 的"模型代工厂"
关键数据
| 年份 | 数据点 | 出处 |
|---|---|---|
| 2024-03 | NIM 在 GTC 2024 发布 | 2024-03 GTC 2024 - Blackwell B200 发布 |
| 2024 | AI Foundry 首批客户:SAP、ServiceNow、Cohesity、Snowflake、NetApp、Dell | 2024-03 GTC 2024 - Blackwell B200 发布 |
| 2025-01 | Llama Nemotron 以 NIM 形式发布 | 2025-01 CES 2025 - Project DIGITS 与 Cosmos |
| 2025-01 | AI Blueprints for agentic AI 配套发布 | 2025-01 CES 2025 - Project DIGITS 与 Cosmos |
相关产品
- NVIDIA AI Foundations —— NIM 的前身,包括 NeMo、Picasso、BioNeMo
- DGX / DGX Cloud —— NIM 的运行底座
- Blackwell —— NIM 在 Blackwell 时代被正式发布
- Cosmos —— Cosmos 模型也以 NIM 形式发布
- 合作框架:CrewAI、LangChain、LlamaIndex、Weights & Biases
备注:NIM 在素材里主要由 GTC 2024 和 CES 2025 两场演讲承载,证据较为聚焦但不算稀少。本卡片所有引用均直接来自素材原文。