黄仁勋新年首秀：除了 Rubin 芯片, 还重新定义了数字员工和物理 AI

文 / 节点 AI 观，作者 | 道哥

美国当地时间 1 月 5 日，英伟达 CEO 黄仁勋率在拉斯维加斯枫丹白露酒店的剧场中心举行新年的第一场演讲。依然是那身熟悉的皮衣。

Anthropic 拒绝龙虾吃自助餐，中国 token 大厂笑了

2026 年 4 月 4 日

AR 眼镜商业化，走到哪一步了？

2026 年 4 月 4 日

通常情况下，英伟达会在春季于硅谷举行的开发者大会上详细介绍其最新芯片的规格和性能。但黄仁勋表示，由于人工智能所需的计算复杂度不断提高，以及市场对先进处理器用于训练和运行 AI 模型的巨大需求，整个半导体行业不得不加快步伐。

在总结 2025 年这一年变化时，黄仁勋特意提到了 DeepSeek R1 的出现意外起到的催化剂作用，另外，在他身后的 PPT 上，还展示了中国开源模型 Kimi K2 和 Qwen。

整个演讲持续一个半小时，仔细看来，这场大会信息密度极高。节点 AI 总结了下分别是 Agentic AI、物理 AI、新芯片三大关键词。

01 芯片新架构 Vera Rubin 全面投产

虽然芯片新架构出现在演讲后半程，但算力作为 AI 的心脏，小编认为还是有必要提前点出：

这次大会上，英伟达发布了一套由六个部分组成的 Rubin 平台—— 包括 Rubin 和 Rubin Ultra 两种规格的 GPU 与 CPU，以及 NVLink 6 交换芯片和 ConnectX-9 SuperNIC。

这款新服务器专为处理创建此类模拟而设计，能将其用于模型训练所需的海量计算负载。命名由来是，20 世纪中期美国天文学家 Vera Rubin，她曾通过对天体运动的开创性观测取得重大科学突破。

黄仁勋评价，每一颗芯片都是革命性的，都值得单独开一场发布会。

从公开数据来看性能惊人：

其中，Rubin GPU 的 NVFP4（4 位浮点数格式）推理算力为 50PFLOPS，是 Blackwell 的 5 倍；NVFP4 训练算力是 35PFLOPS，是 Blackwell 的 3.5 倍；HBM4 内存带宽 22TB/s，是 Blackwell 的 2.8 倍，晶体管数量 3360 亿个，是 Blackwell 的 1.6 倍。与 Blackwell 平台相比，Rubin 平台通过软硬件协同设计，将推理 token 成本降低 10 倍，将训练 MoE 模型（专家模型）所需的 GPU 数量减少 4 倍。

“ 如果我们不做协同设计，即便在每年提升 1.6 倍晶体管数量的最好情况下，以及在每个晶体管性能提升一些，例如提升 25% 的情况下，也难以获得巨大的性能提升。” 黄仁勋表示，这就是为什么要做另外一些事情，例如推出 NVFP4，以便在可以损失精度的地方实现更高的吞吐量。这种协同设计，使新的芯片平台可以有比较大的性能提升。

从商业化步伐来看，英伟达下一代 AI 超级芯片平台 Vera Rubin 已进入全面量产，2026 年下半年开始向合作伙伴交付,AWS、Google Cloud、Microsoft、Oracle 等主要云服务商已确认部署。