财联社 2 月 28 日讯 (编辑 夏军雄)据媒体援引消息人士报道,芯片巨头英伟达计划发布一款全新处理器,专门为人工智能 (AI) 研究公司 OpenAI 及其他客户打造,以帮助他们构建更快速、更高效的工具。
知情人士透露,英伟达正在设计一套新的推理计算系统。这一新平台预计将在下个月于圣何塞举行的英伟达 GTC 开发者大会上发布,并将整合由初创公司 Groq 设计的芯片。
推理计算是一种让 AI 模型能够对用户提问作出响应的处理方式,该领域已成为行业激烈竞争的焦点。谷歌和亚马逊等公司已经设计出与英伟达旗舰系统相竞争的芯片。
而科技行业中自动化编程的迅猛发展,也催生了对新型芯片的需求,这些芯片需要更高效地处理复杂的 AI 相关任务。
知情人士表示,OpenAI 已同意成为这款新处理器的最大客户之一,这对英伟达而言是一项重大胜利。
作为英伟达最大的客户之一,OpenAI 在过去几个月一直在寻求比英伟达芯片更高效的替代方案,并在上个月与芯片初创公司 Cerebras 签署协议,为自身提供更多选择。
英伟达 GPU 的潜在挑战
英伟达长期主导着 GPU(图形处理器) 市场。据分析师估计,英伟达控制着 90% 以上的 GPU 市场份额。
GPU 是一种能够同时执行数十亿个简单任务的处理器。
英伟达 Hopper、Blackwell 和 Rubin 系列 GPU 被认为是训练超大型 AI 模型的行业标杆产品,价格也处于高位。
然而,自 AI 热潮兴起以来,英伟达首次面临其旗舰产品的局限性。随着市场重心从训练转向推理,一些客户开始向英伟达施压,要求其推出更高效驱动 AI 应用的芯片。
过去一年,随着企业部署 AI 代理及其他工具,先进算力的需求已从训练转向推理。AI 代理是能够相对自主地代表用户执行任务的系统。
许多构建和运营 AI 代理的公司发现,GPU 成本过高、能耗过大,而且在实际运行模型方面并非最佳选择。随着 「代理式 AI」(agentic AI) 的迅猛崛起,英伟达正面临开发更低成本、更高能效推理芯片的压力。
上个月,OpenAI 与 Cerebras 签署了一项价值数十亿美元的计算合作协议。Cerebras 提供专注于推理的芯片,该公司称其芯片比英伟达 GPU 更快。
对英伟达而言,谷歌自研芯片张量处理单元 (TPU) 同样也是重要挑战者。事实上,谷歌正在推进使 TPU 能够取代 GPU 的计划。
为了巩固护城河,英伟达去年年底同意支付 200 亿美元,以获得 Groq 的关键技术授权,并聘请其高层团队,包括创始人乔纳森·罗斯 (Jonathan Ross)。这是硅谷历史上规模最大的 「人才并购」(acqui-hire) 交易之一。
Groq 设计的芯片采用不同于英伟达的架构,被称为 「语言处理单元」(Language Processing Units),在推理功能方面效率极高。不过,英伟达迄今尚未公开说明将如何运用 Groq 的技术。















