
图片系 AI 生成
AI 快节奏的变化,已然打破原有产业链的运行方式,从芯片、基础设施,再到模型和应用,产品的设计逻辑已被改写。Token 经济下,AI 正从工具应用走向生产要素,算力也随之从资源供给升级为面向 Token 生产的系统能力。
爆发式的需求让 Token 工厂成为资本和产业界追捧的热点,亦是今年产业发力的关键点。整个产业正在进入由“ 能力竞争” 迈向“ 生产范式竞争” 的新阶段,对算力规模、效率与能效提出了更高要求。
对于算力基础设施服务商来说,走了几十年的 “ 稳态” 路线成了过去式,需要将分散、复杂的 AI 能力转化为标准化、规模化的生产能力,为客户提供面向未来的企业 AI 解决方案。
正如国际核能院院士、中国人工智能学会会士张勤所说:“ 随着 AI 从语言理解迈向对物理世界的认知与交互,算力基础设施也必须从单点供给升级为算力、网络与能源协同的系统性底座,才能真正支撑智能应用的规模化落地。”
只是,Token 经济听起来很美,真正要跑通,不只是在算力层,在应用层、模型层等都还有无数的坑需要填。
算力产品底层逻辑已经改写
Token 正在彻底重构算力世界,成为中国 AI 产业的核心“ 货币”。据相关机构预测,2026 年中国整体 Token 调用量将达日均 306.3 万亿,2030 年有望达到 19306 万亿,2025 至 2030 年复合增长率高达 210%。而在 Token 经济的“ 冲击” 下,算力基础设施的底层逻辑也在被彻底改写。
过去,在 AI 没有真正火起来之前,服务器产品还是集中在通用计算和超算,那时候做产品规划更多是以追随上游厂商的 CPU 路线为主。而芯片的路线图一般在三五年之内都很清晰,不会有较大的变动,因此基础设施产品的定义是一个“ 稳态” 的模式,可以把未来三年、五年一起都规划了。
不仅如此,当初的设计出发点就是要量产,需要适配所有的 CPU、各种型号的 SSD、HHD 等,中间还要不断的验证,因为要保证产品在客户端每一个配置都不会出问题。并且,所有客户的需求要摸清楚,各种成本要摸清楚,确保产品一上市就是一个爆款。
但 AI 时代到来后,一切都变了,整个产品的路线出现了一些不确定性,特别是 GPU,可能产品还没有来得及上市,就已经过时了。
“ 等你摸清楚所有市场的需求,你摸清楚的那些可能已经变了。” 联想中国基础设施业务群服务器事业部总经理周韬指出,模型、应用的层面更新更加快,当我们发现 DeepSeek 可以搞一体机,刚搞出来,好像就已经过时了。今年年初龙虾火了,但最近好像也不是那么热了。
这时,如果还沿用稳态模式跟跑,只会永远慢市场半拍,算力产品的研发逻辑正在全面转向敏态。所谓敏态,核心就是放弃“ 全量适配、一步量产” 的传统思路。

现如今,客户要的配置可能相对特别单一,没有那么复杂,不用把所有想得到的都进行交叉验证,快速迭代最好是让客户去看哪个是他真正需要的,快速形成一个产品,送测之后,客户觉得不错再把它转为量产的产品。
“ 这样可以把原来从 18 个月,甚至更长演化、规划的时间,缩短到几个月的时间,投资的成本也会降低很多。原来一年的研发预算只能投两三个产品,现在这种敏捷的模式,我就能投 10 个产品、15 个产品,并不需要每一个投的产品最后都成功,可能投了 10 个,有三四个成功就行了。” 周韬说道。
在这套逻辑下,联想问天也改变了原有的产品规划模式,并新推出万全异构智算平台 V5.0、超节点解决方案,提出到 2027 年联想中国基础设施群要做到 1000 亿元的业绩目标,推动算力基础设施从“ 资源支撑载体” 向“ 词元生产系统” 转变。
周韬表示:“ 我们的目标,是让客户以更高效率、更低成本实现 AI 规模化应用,让算力从资源供给真正转化为可交付、可扩展、可持续的生产能力。”
Token 工厂,还有无数的坑要填
产品研发逻辑的迭代,只是 AI 时代下变化的第一步。联想问天在做的,一个是通过 AI 工厂、超智融合算力与全栈产品体系,将分散、复杂的 AI 能力转化为标准化、规模化的生产能力;另外一个,则是通过构建高性能、低成本、可持续的基础设施底座,为客户提供面向未来的企业 AI 解决方案。
不过,推动算力从资源供给走向价值生产,当行业真正试图把算力中心变成“Token 工厂”,才会发现,面前还有很多坑要去填。
其中,计算系统就需要六大工艺去填补,每一项都是决定 Token 成本与效率的关键。比如计算调优工艺、缓存的工艺。缓存是目前国产卡做推理最大的瓶颈,需要进一步做好 KVcache 命中以及缓存的量化。谷歌的相关技术论文曾引发存储板块股价大幅波动,足见缓存优化对 Token 效率的影响力,也是当前国内算力厂商必须啃下的硬骨头。
除此之外,在计算层面,还要做好容错、用电、通信以及能耗的工艺等。这些工艺的差距,也正是为什么同样的 GPU 配置,不同厂商的集群跑出的 Token 吞吐量天差地别的原因。
而在填完计算这个坑后,还有数据治理、能效管理、安全合规、运维管理等短板需要解决。联想中国基础设施业务群战略总监黄山透露,在安全层面,正在与火山合作,因为全中国被攻击最狠的是豆包。“ 现在的测试版本到了第二版,接近满意,我希望第三轮之后,在 7 月份把它发到市场,目标是能达到火山在公有云防豆包攻击测试水平。”
需要指出的是,对于整个 Token 经济来说,算力基础设施解决不了所有的卡点。黄山坦言,即便把数据、计算、安全、能效这些坑都填平,也只是能经营好一个 AIDC,卖 Token 而已,这个时候 AI 应用落地会怎样?模型有没有选对?智能体做的好不好?架构、算力在 AIDC 之上还有几个卡点。
简单来说,上层应用不成熟,对 Token 的需求就起不来,算力投资难以收回成本。Token 成本居高不下,企业就不敢大规模投入应用创新,场景就永远跑不出来。
“ 好在全世界那么多的大咖下了很大的决心往里面使劲砸钱,我们希望这些钱能够用到对的技术上。” 黄山说道。(文 | 志读科技,作者 | 杜志强)
更多精彩内容,关注钛媒体微信号 (ID:taimeiti),或者下载钛媒体 App
















