产品

GR00T

基本信息

定义

GR00T 是 NVIDIA 面向人形机器人的通用基础模型。它的核心理念是:就像大语言模型是文本世界的基础模型,GR00T 要成为物理世界里人形机器人的基础模型——让机器人能够从少量人类演示中学习日常任务、通过观察模仿人类动作、并根据自然语言指令生成行为。

黄仁勋选择"人形"作为 GR00T 的目标形态有一个非常实用的理由:"下一代机器人很可能是人形机器人,原因很简单:我们能给它们的模仿数据最多——因为世界是为我们这种形态设计的。我们的工作台、制造线、物流、仓储都是为人设计的,所以人形机器人部署起来会最有效率。"

发展历程

黄仁勋对它的评价

"下一代机器人很可能是人形机器人,原因很简单:我们能给它们的模仿数据最多——因为世界是为我们这种形态设计的。我们的工作台、制造线、物流、仓储都是为人设计的,所以人形机器人部署起来会最有效率。"
——2024-03 GTC 2024 - Blackwell B200 发布

"物理 AI 和机器人正在飞速前进。所有人注意这个方向,这很可能是有史以来最大的产业。"
——2025-03 GTC 2025 - Blackwell Ultra 与 Vera Rubin

"本 decade 结束前,世界将缺少至少 5000 万个人类劳动力。我们会非常乐意付每人 5 万美元年薪——可现在我们大概要付 5 万美元年薪给机器人。"
——2025-03 GTC 2025 - Blackwell Ultra 与 Vera Rubin

三台计算机框架

GR00T 存在于黄仁勋反复强调的"三台计算机"框架中:

  1. 第一台DGX 超级计算机——训练 GR00T 基础模型
  2. 第二台NVIDIA Omniverse OVX——在虚拟世界中仿真和强化学习("机器人的健身房")
  3. 第三台:AGX / Jetson——装在机器人体内,运行推理

GR00T 的训练闭环还依赖 Cosmos(生成合成训练数据)和 Newton(提供物理保真的仿真环境)。

GR00T N1 双系统架构

GTC 2025 发布的 GR00T N1 引入了认知科学启发的双系统架构:

这种架构让机器人既能在毫秒级别做出运动反应(不被绊倒),又能在秒级别做出策略规划(决定下一步该拿哪个零件)。

体现的核心概念

相关产品