(本文作者为 划重点 KeyPoints,钛媒体经授权发布)
文 | 划重点 KeyPoints, 作者|林易,编辑|重点君
刚过去的三月份,AI 行业最热的词属于 Token(词元)。几件事情几乎同时发生:
国内,国家数据局局长刘烈宏在中国发展高层论坛宣布:中国日均Token 调用量已突破 140 万亿,较两年前的 1000 亿暴增千倍。
海外,英伟达创始人黄仁勋在GTC 大会上说:Token 将是未来数字世界最核心、最值钱的大宗商品,Token 的吞吐量将成为全球企业 CEO 追踪的核心经营数据。
同样在三月,阿里云在财报电话会上公布了一个非常激进的目标:五年内云与AI 商业化年收入突破 1000 亿美元,隐含年复合增长率约 47%。此外,字节跳动云计算业务火山引擎的豆包大模型日均调用量超过100 万亿 Tokens,跻身全球前三。
云计算作为AI 时代的底层基础设置,重要性越来越高,而 AI 云正成为一门真正的好生意。
什么是好生意?在科技行业,标准基本可以概括为三条指标:规模效应带来的边际成本递减、客户生态锁定带来的高转换成本,以及建立在标准化产品之上的高毛利率与经常性收入。
这三条,亚马逊AWS、微软 Azure、谷歌Cloud几乎同时满足。它们通过提供标准化的IaaS、PaaS、SaaS,构建了高壁垒、高利润的商业闭环:资源池越大成本越低,客户一旦迁入就难以离开,软件订阅则持续产生高毛利现金流。2025 自然年,这三家云厂商的利润分别高达456亿、540亿和139.1 亿美元。
但中国云计算却走上了一条截然不同的路。过去十几年,尽管市场大盘不断扩大,但国内云厂商长期陷入了重资产、低毛利、高度内卷的集成商困境,利润却始终做不上去。背后原因在于特殊的IT 消费习惯、贫弱的SaaS 生态,以及大型政企客户对高度定制化的偏好。传统 IaaS 阶段,由于各家云厂商提供的计算、存储和网络资源高度同质化,市场竞争最终往往沦为价格战。为了争夺非互联网行业的政企大客户,云厂商做了大量低毛利、高人力的定制化开发与本地部署工作,这使得云计算从一种本应具备高度规模效应的轻量化服务,变为了以人力和硬件堆砌为主的传统IT 项目制生意。
直到这一轮AI 浪潮,为国内云计算厂商带来了重构商业模式的机会:将大模型封装成可调用、可计费的标准化云服务,卖给企业与开发者,成为新的增长引擎。
从价格战到涨价潮
AI 首先推动了云计算行业的结构性增长。2025 年第一季度,中国云基础设施服务支出达 116 亿美元,同比增长 16%,AI 相关需求已成为推动企业向云端迁移的主要动力。另据Omdia 报告,2025 年中国 AI 云市场规模预计达 518 亿元,同比增长 148%,到 2030 年将突破 1930 亿元。(注:各家云厂商对AI 云的定义有所不同)
但增长背后曾是惨烈的价格战。2024 年 5 月,火山引擎旗下豆包大模型在国内率先掀起大模型的降级潮,此后,阿里云、百度智能云等相继跟进,大模型Token 定价在不到一年内狂降超 90%,部分云厂商的推理算力毛利率跌为负数。他们策略是“以亏损换规模”,毕竟谁能先在开发者和企业客户中建立起API 调用习惯,谁就能在未来占据主动。
直到2026 年初,价格战信号才开始逆转。海外,亚马逊AWS 与谷歌Cloud先后宣布涨价,国内,阿里云、百度智能云、腾讯云随即跟进。3 月 18 日阿里云和百度智能云同步官宣涨价,其中:
阿里云最高涨34%:对AI 算力、存储等产品进行调价。其中,采用自研芯片的平头哥真武 810E 等算力卡产品上涨 5%-34%;满足高性能计算的文件存储产品CPFS 上涨 30%。新价格于 2026 年 4 月 18 日起执行。
百度智能云最高涨30%:AI 算力相关产品服务上调约 5%-30%;并行文件存储等上调约 30%。同样于 2026 年 4 月 18 日起生效。

涨价最直接的导火索就是激增的Token需求。单纯的大模型对话带来的Token 消耗有限,而 2026 年 Agent 爆发和多模态模型成熟彻底扩容了AI 云市场。尤其是Claude Code、OpenClaw 等智能体产品的走红,让科技公司意识到,一次智能体任务往往包含多轮内部推理、工具调用和任务执行,其 Token 消耗量通常显著高于普通的 AI 对话。算力需求从“云端训练”彻底转变为“ 训练+推理” 双轮驱动,导致现有 AI 算力资源极度紧缺。
正是这种算力供需关系的变化,直接催生了商业计费模式的改变。
从IaaS 算力租赁到MaaS Token 经济学
在传统的IaaS 阶段,云厂商的核心商业模式是作为“ 二房东”,出租底层计算资源、存储空间和网络带宽,同质化严重。
Token出现打破了这一局面。Token 是 AI 模型处理语言、图像、音视频的最小语义单元,用户每次与大模型交互,最终都被拆解成 Token 完成运算。以 Token 计费,云厂商从"卖硬件使用权"转变成了"卖智能服务"。
这套模式有优势非常明显:首先是抹平了硬件同质化。用户不再关心底层是什么GPU,只关心同等 Token 能否完成任务;其次是天然放大了规模效应。算力池越大,并发调度效率越高,分摊到每个Token 的边际成本越低;最后是标准化API 接口形成了生态锁定,调用习惯一旦建立,迁移成本极高。云服务真正变成了像水电一样,打开即用,接上即跑。
云厂商也正在将紧缺的AI 算力资源向高附加值的 Token 业务倾斜。比如,腾讯云在过去一个多月快速整合资源,推出了覆盖云端、C 端及企业版的“ 龙虾” 产品矩阵,并直接将原有的 MaaS 大模型服务平台升级为 TokenHub,推出统一的 Token Plan 服务。
智能体的普及使得原本按次调用的能力变成了高频、自动化的服务,极大地推高了云厂商的Token 流水,也让 MaaS 业务有望在未来占到云厂商整体收入的 30% 甚至更高。
据《财经杂志》 报道,2025 年 12 月末,阿里云智能集团资深副总裁、公共云事业部总裁刘伟光在一场小规模沟通中称,MaaS 收入在云厂商整体收入的占比,有可能达到 30% 甚至更高。此外,亚马逊AWS 管理层在2025 年三季度财报电话会议上也曾披露,要把Bedrock 打造成全球最大的推理平台,收入贡献将与其核心计算产品EC2 不相上下,预计在总营收中占比超过30%。
而这正是顶级云生意所需要的"经常性、高毛利、可复制"的收入结构。
AI 云的胜负手是全栈成本的竞争
模式虽好,但AI 云的竞争正变得日趋激烈。
海外,转型AI 云,成为亚马逊 AWS、微软 Azure、谷歌Cloud、甲骨文OCI 的共同目标;国内,阿里云、百度智能云、腾讯云、火山引擎、华为云等科技云厂商,也纷纷强化自己的AI 属性。各家云厂商的资本开支,也持续创新高。
在我们看来,AI 云的竞争不是单纯的算力竞争,而是全栈成本的竞争。胜负手不在于谁的GPU 更多,而在于谁能实现最低的"单位 Token 成本"。
美国四大云厂商的竞争已经验证了这个逻辑。谷歌是全栈整合程度最高的玩家,Gemini 系列模型由自研 TPU 训练、部署在 TPU 上,芯片、模型、云服务三位一体,同时掌握成本控制权与定价权。亚马逊累计交付超 140 万枚自研 Trainium 2 芯片,性价比比同类英伟达 GPU 高 30%-40%。反面教材案例甲骨文,无自研芯片,算力建设完全依赖英伟达,资本支出超过自身经营性现金流,同时高度依赖OpenAI 单一客户,处境最为脆弱。
中国云厂商面临同样的竞争逻辑,叠加地缘压力,维度更为复杂。
阿里云拥有规模与全栈的双重优势,护城河最深。百炼MaaS 平台聚合通义千问、DeepSeek 等数十款主流模型;已累计向实际业务部署出货超过 47 万颗 AI 芯片,60% 以上服务于外部商业化客户。未来三年,阿里宣布将投入超 3800 亿元用于云和 AI 基础设施建设。
百度智能云不急于抢Token 流量规模,而是向能源、金融、汽车等垂直行业的核心流程深度渗透,凭借自研芯片昆仑芯、文心大模型与千帆平台的"芯-云-模-体"全栈自研体系,连续两年拿下国内大模型招投标项目数和中标金额双料第一。
火山引擎走的是激进的MaaS 优先路线。字节跳动内部抖音、视频创作、Seedance 视频生成模型等庞大的应用生态,平摊了基础设施固定成本,让火山引擎在Token 价格上得以持续激进定价。据 《晚点》 报道,火山引擎此前曾定下了2026 年 MaaS 业务收入超百亿元的目标,随着 Seed 2.0、Seedance 2.0 等模型发布、OpenClaw 持续爆火,团队已提升了收入目标。
腾讯云过去几年实现艰难转型。2022 年前后,腾讯云主动砍掉低毛利总包业务,聚焦高毛利自研PaaS/SaaS 产品,将"被集成"而非"总集成"树立为核心战略。短期市场份额承压,但改善收入结构:2025 年 IaaS 占四成、PaaS 占四成、SaaS 占两成,而 PaaS 与 SaaS 的毛利率维持在 50%-70%,远高于 IaaS 的 10%-15%。成立12 年后,首次实现规模化盈利,马化腾在财报中将其列为当年核心成就。
生成Token 的成本与效率决定一切
AI 将云计算的计费单元从同质化的算力资源转向差异化的智能服务;Token 的爆炸式增长,使 MaaS 层收入很长一段时间内看不到天花板;标准化API 带来的规模效应与生态锁定,正在赋予头部云厂商一定程度的定价权。
AI 让云计算的生意模式变好了,但机会注定只属于少数玩家:有充裕的现金流,能承受千亿级算力军备投入;能自研芯片或深度国产算力整合能力,在英伟达生态之外构建成本控制能力;以及有自研模型和MaaS 工程化落地能力,因为模型强弱直接决定单卡Token 吞吐量,决定单 Token 成本,最终决定毛利率。
正如黄仁勋所说:生成Token 的成本与效率,决定科技企业的营收与生死。
更多精彩内容,关注钛媒体微信号 (ID:taimeiti),或者下载钛媒体 App














