财联社 3 月 13 日讯 (编辑 史正丞)排队装 「龙虾」 的热潮即将吹到加州圣何塞。算力巨头英伟达下周将举行年度 GTC 大会。今年除了发布新产品外还有特别的现场互动环节——英伟达技术专家现场帮忙装 「龙虾」。
据英伟达官方博客介绍,在下周一至周四的 GTC 大会期间,除了黄仁勋周一演讲的两个小时外,GTC 公园将全程举行 「搭建龙虾」 活动,与会者可以在现场部署一个始终在线的 AI 助手。
(来源:英伟达博客)
算力巨头也含蓄地指出,希望大家能带着英伟达芯片驱动的设备来参加活动,包括算力 (和价格) 都远远超过 Mac Mini 的个人超算 DGX Spark,现场将提供硬件购买,也可以将 「龙虾」 直接部署在云端。

(这台桌上电脑的售价达到 4699 美元,相当于人民币 3.2 万元)
官方数据显示,下周将有来自全球 190 多个国家和地区的 3 万余人现场参会。考虑到其中不少都是专业开发者,今年的 GTC 不仅会成为 「龙虾大会」,甚至有可能成为一场 「斗虾大会」。

还有哪些关注焦点?
GTC(GPU 技术大会) 是英伟达的年度旗舰活动,公司通常会在大会期间发布新产品,并阐述产业发展的愿景。
对于资本市场而言,英伟达掌门黄仁勋于当地时间周一中午 11 点 (北京时间周二凌晨 2 点) 发表的主题演讲将是重中之重。
硬件方面,算力芯片路线图、潜在的推理芯片以及自有光通信产品已经成为资本重点埋伏的概念。
美银证券资深分析师 Vivek Arya 在本周的研究报告中概述称,重点关注的方向有三个:
1) 延伸至费曼架构的最新产品路线图;
2) 一系列全新的协同设计 (定制化) 且模块化拆分的产品 (例如用于推理预填阶段的 CPX,以及用于低延迟解码的 LPU);
3) 用于大规模扩展系统的自研光互连技术(例如集成 CPO 的交换机等)。
Arya 也展望称,英伟达可能会讨论 102.4T Spectrum-6 交换机 (可与 Rubin 平台配套使用) 以及 115T Quantum-X 交换机 (采用共封装光学 CPO 技术)。英伟达甚至可能与英特尔联合发布一款定制化 x86 CPU,进一步扩大其在企业数据中心的采用范围,甚至延伸到消费级 CPU 市场。

Arya 也表示,不指望黄仁勋会正式给出未来两年的销售数据指引,但有关 Rubin 架构量产爬坡的消息,可能会对横盘多时的股价形成提振作用。

(英伟达股价从去年 8 月震荡至今,来源:TradingView)
至于黄仁勋预告的 「前所未见芯片」,目前猜测也集中在英伟达与推理芯片公司 Groq 合作发布的 LPU 上。
推理是指 AI 模型将训练中学到的知识用于决策和生成响应的过程。有别于训练 AI 所需的算力,更快、成本更低的推理被视为大规模推广 AI 应用的最后瓶颈之一。若这款芯片如期落地,意味着在训练市场上占据主导的英伟达,将正式出手应对谷歌、微软等公司定制芯片的竞争。
Zacks Investment Research 的高级股权策略师 Kevin Cook 也表示,投资者也期待黄仁勋讲清楚英伟达将如何处理与 Groq 的关系。据悉,英伟达去年底支付了 200 亿美元,拿到 Groq 的专利许可,同时 Groq 创始人 Jonathan Ross、总裁 Sunny Madra 以及核心团队成员都已经加入英伟达,这一合作引发广泛的关注。
软件层面,本周有爆料称英伟达将发布一个面向企业 AI 代理的开源平台,名为 NemoClaw(这里也有 「龙虾」)。该平台将为企业提供一种结构化的方式来构建和部署 AI 智能体,即能自主执行多步骤任务的软件。
「黄仁勋圆桌」 聚焦开放模型
作为近年来 GTC 的惯例,下周黄仁勋也将会举行圆桌谈话,展示英伟达眼里最重要的产业方向。
今年的主题是 「开放模型的现状与未来」。AI 编程明星公司 Cursor、AI 搜索引擎 Perplexity、医疗 AI 助手 OpenEvidence 等一众行业新锐公司,以及创办思考机器实验室的前 OpenAI CTO Mira Murati 都将出席。

英伟达的公告中介绍称,过去一年里,AI 领域最重要的变化之一是开放前沿模型的快速进展。开放式创新正在加速各公司和各行业的进步,明确展现 AI 将无处不在。黄仁勋将与这些行业领袖一起,就 「开放前沿模型的最新进展及其未来进行坦率讨论」。
本周早些时候,有媒体挖掘英伟达去年底的一份财报发现,算力巨头未来五年将累计投入 260 亿美元用于算力租赁,这些云服务协议将用于支持公司的研发工作以及 DGXCloud 产品服务。有英伟达高管对媒体确认,开源模型训练的成本也涵盖在内。 据悉,这一规模是 OpenAI 训练 GPT-4 成本的 8 倍有余。
英伟达也在本周发布公司迄今为止最强大的开源权重 AI 模型 Nemotron 3 Super,专为大规模运行复杂智能体系统设计。











