产品

NIM

基本信息

一句话定位

NIM 是 NVIDIA 在 Blackwell 时代给出的"AI 时代的软件分发单位"——把每一个预训练模型打包成可在 NVIDIA 任何硬件上即装即跑的微服务,让企业可以像组装乐高一样把多个 NIM 拼成 agent 团队。"NeMo + NIM + DGX Cloud"是 NVIDIA 的三层 AI Foundry 栈。

发展历程

黄仁勋对 NIM 的评价

"一个 NIM 就是一个预训练模型,已经打包好、已经优化好,可以在 NVIDIA 的所有硬件上跑。你去 ai.nvidia.com 就能下载。"
——2024-03 GTC 2024 - Blackwell B200 发布

"想象一下,某一天你用一个聊天机器人——它本身就是一个 NIM。它的一部分执行计划可能被交给另一个 NIM:比方说一个懂 SAP 和 ABAP 的 NIM、一个懂 ServiceNow 的 NIM;再交给另一个 NIM 去做组合优化计算。所有这些 NIM 拼在一起像一个团队一样协作,做惊人的事情。"
——2024-03 GTC 2024 - Blackwell B200 发布

"这里正在浮现三根支柱。第一根是发明 AI 模型技术,并且替你把它打包好——这就是 NIM。第二根是帮你修改它的工具——这就是 NeMo Microservices。第三根是帮你微调和部署的基础设施——这就是 DGX Cloud。我们本质上是一家 AI Foundry。"
——2024-03 GTC 2024 - Blackwell B200 发布

体现的核心概念

关键数据

年份 数据点 出处
2024-03 NIM 在 GTC 2024 发布 2024-03 GTC 2024 - Blackwell B200 发布
2024 AI Foundry 首批客户:SAP、ServiceNow、Cohesity、Snowflake、NetApp、Dell 2024-03 GTC 2024 - Blackwell B200 发布
2025-01 Llama Nemotron 以 NIM 形式发布 2025-01 CES 2025 - Project DIGITS 与 Cosmos
2025-01 AI Blueprints for agentic AI 配套发布 2025-01 CES 2025 - Project DIGITS 与 Cosmos

相关产品


备注:NIM 在素材里主要由 GTC 2024 和 CES 2025 两场演讲承载,证据较为聚焦但不算稀少。本卡片所有引用均直接来自素材原文。