
过去两年,AI 行业只卷一件事:谁的模型更聪明。参数千亿卷向万亿,上下文窗口从几 K 拉到上百万。但尴尬的现实是:除了写邮件、做摘要这些“ 轻量级表演”,AI 依然像个被困在对话框里的超能大脑,它懂很多,但做不了什么。
真正的分水岭已经出现。当前 AI 产品的胜负手,根本不在“ 谁聊天更聪明”,而在谁能把 Agent 放进用户高频使用的入口,并获得权限、上下文和执行机会。
北京时间今天凌晨,苹果在 WWDC26 上给出了自己的答案:Siri AI 脱胎换骨,拥有独立 App 和灵动岛气泡,由谷歌 Gemini 提供底层支持,这是 Siri 自 2011 年以来最激进的改版。但苹果的这一步,只是入口战争全面爆发的信号弹之一。
大模型是大脑,入口是双手。没有手的大脑,只能提供咨询。有了手的大脑,才能接管执行。用户不会为“ 更聪明的对话框” 付费,但绝对会为“ 省事的代理人” 买单。
从点击到授权
想象 2027 年的一个早晨:你说“ 帮我安排今天”。Agent 已经读过邮件 (发现客户提前了会议)、查看日历 (下午有空档)、扫描聊天记录 (知道你要买生日礼物),于是自动做了三件事:改期并通知参会人、预约商场取货、比价下单乐高。你唯一的动作是回复“ 确认”。
这就是执行权的终极形态:从“ 人挥鞭子赶车”,变为“ 人只管签字画押”。
数字文明史上,入口战争已爆发过两次:PC 时代微软靠 Windows 绞杀网景,夺的是 OS 入口。移动时代苹果和 Google 靠应用商店垄断分发,收的是安装税。每一次计算范式迁移,都重塑了入口格局。
而今,Agent 正在掀起第三次入口战争。前两次争夺的是“ 点击发生的场所”,这次争夺的是“ 执行发生的许可”。
传统交互逻辑是:意图 → 寻找 App → 操作 → 完成。AI 时代的终极交互将是:意图 → Agent 自动调用资源 → 完成。未来的超级 AI 大概率不是你特意打开的 App,而是隐匿在系统背后的“ 隐形智能体”。它通过日常数据主动推断意图,直接调用 API 完成任务。

AI 不再是一个你打开的应用,而是应用打开你的世界。
一旦用户形成“ 默认授权” 习惯,切换成本将高到不可逾越。谁先让用户喊出“ 嘿 Siri,帮我……”“Copilot,去……”,谁就锁定了下个十年的护城河。但前提是,用户敢不敢把支付、发信的权利交给黑盒?Agent 要实现跃迁,必须跨越三道门槛:在用户必经之路上 (触点)、读懂用户真实数据 (上下文)、替用户操作执行 (权限)。
大模型的智力正变成水电煤,而“ 入口+权限” 才是收过路费的护城河。
四路军突围
基于现有版图,Apple、Meta、Microsoft、Google 正从四个截然不同的方向,试图将 Agent 植入用户的数字心脏。
苹果:“ 端侧领主” 的硬件特权与隐私结界
苹果的底气是 25 亿台活跃设备 (2026 年 1 月数据)。它的路线是典型的“ 端侧特权”:利用 NPU 和 Apple Silicon 把 AI 做进系统底层,Agent 化为轻量级插件 (App Intents),并祭出“ 隐私” 武器,敏感计算本地完成,以此换取信任授权。
苹果是唯一掌控硬件层和系统级权限的玩家,但隐忧在于端侧算力的物理天花板与 Siri 长期的“ 弱智” 包袱。若端侧处理不了复杂任务,云端又被隐私承诺捆住,苹果可能沦为“ 安全的哑终端”。更危险的是,欧盟 《数字市场法》 正紧盯其接口互操作性,封闭生态面临强拆风险。
Meta:“ 社交市集” 的流量截流与浅层困局
Meta 没有操作系统,但它有全球最庞大的社交消息入口。根据 2026 年第一季度财报,旗下全应用日均活跃用户 (DAP) 达 35.6 亿,覆盖 Facebook、Instagram、WhatsApp、Messenger 和 Threads。每天百亿级的消息在此流转,其中蕴藏着海量的“ 商业意图”(咨询、预约、购物)。
Meta 的策略极度务实:死磕“ 商业消息流”。2026 年 6 月上线的 Meta Business Agent,让用户在聊天界面内就能完成从种草到下单的闭环。离钱最近是它最大的优势,但缺乏系统底层权限是致命伤。一旦涉及跨应用调度 (如调取日历、操作文件),它就无能为力。若始终只能做浅层客服,无法深入企业 ERP,Meta 将永远被困在“ 聊天娱乐” 范畴。
微软:“ 数字包租公” 的工作流深度绑定
Meta 占据生活,微软占据工作。数亿白领每天在 Outlook、Teams、Word 里运转。微软的 Copilot 是典型的“ 工作流嵌入”:写邮件时自动补全,开完会自动提取待办写入 Planner。2026 年 3 月推出的 Copilot Cowork(底层采用 Claude 模型),更实现了自动发邮件、安排会议等执行操作。
当 Agent 掌握了通讯录和项目进度,就成了不可或缺的执行者。极强的 B 端付费意愿和坚固闭环是其护城河,但企业级合规审批让它的动作偏保守。若每个动作都要三级审批,它将比手动操作更慢而被员工抛弃。
谷歌:“ 搜索大帝” 的左右互搏与自我颠覆
谷歌处境最微妙,AI 颠覆搜索首当其冲是自己。它双管齐下:Android 端用 Gemini Nano 争端侧,云端用 Search 和 Gemini API 将“10 个蓝色链接” 升级为“Agent 执行结果”。2026 年 5 月发布的 Gemini Intelligence,实现了从备忘录购物清单到加购配送的跨应用自动化。
谷歌手握全球最大意图分发入口和开放 API 生态,但陷入了“ 创新者窘境”:Agent 直接出票,用户不点链接,广告怎么收?若为保广告收入给 Agent 戴镣铐,可能重蹈雅虎覆辙。此外,美国司法部反垄断诉讼若致使其拆分,剧本将彻底改写。
用触点、上下文、权限三个维度来审视四家巨头,各自的优劣势一目了然:

没有一家同时拿下三个维度。入口战争的终局,取决于谁能在自己的短板维度上找到突破口。
中国战场的变量
同样的入口战争正在中国上演,但剧本不同。中国玩家面临的不是“ 技术路线分化”,而是“ 生态壁垒森严”,每家巨头都坐拥一座数据孤岛,彼此之间筑墙深挖,Agent 的跨应用调用远比美国更艰难。
原生 App 只是前哨。QuestMobile 2026 一季度数据显示 AI 原生 App 月活达 4.4 亿,字节豆包以 3.45 亿领跑。但真正的暗流在更深处。
2025 年底至 2026 年初战局全面升级。小米上线系统级智能体“Xiaomi miclaw”,鸿蒙 6 上线 80 余个应用智能体,阿里开源 GUI 智能体 MAI-UI。手机厂商与 AI 公司合纵连横:字节牵手中兴推出豆包手机,阿里向瑞幸、肯德基等全面开放品牌 Agent,腾讯测试微信内置 AI 智能体。中国四强格局已从“ 模型竞赛” 转入“ 入口战争” 阶段。
最激进的是字节。豆包以 3.45 亿月活领跑 AI 原生 App,字节的策略是“ 软硬通吃”。软件端,豆包 App 持续吞噬通用问答和内容生成场景。硬件端,牵手中兴推出豆包手机,将 Agent 植入手机系统。
字节的杀手锏是流量分发能力,抖音和今日头条的推荐算法积累的“ 用户理解” 可以无缝迁移到 Agent 场景,豆包知道你喜欢什么、什么时候需要什么。但短板同样明显,缺乏社交关系链和办公场景,豆包手机要调用微信、支付宝时,面对的是森严的商业护城河。字节的入口,目前仍是“ 内容消费” 而非“ 生活执行”。
和字节的“ 流量思维” 不同,阿里打的是“ 交易” 这张牌。
千问 App 在 2026 年 6 月宣布向第三方 Agent 和 Skill 全面开放,瑞幸、肯德基等品牌已入驻运营自己的 Agent。同时,千问与淘宝全面互通,用户可以在对话中完成选品、比价、下单。阿里最大的优势是“ 离交易最近”,Agent 直接嵌入电商和本地生活场景,闭环最短。但阿里的劣势同样来自这个基因,它的入口高度集中在“ 买东西” 这件事上。一旦用户需求偏离交易,千问就失去了上下文优势。阿里需要证明自己不只是“ 购物助手”。
如果说阿里打的是“ 交易”,腾讯打的就是“ 关系”。微信超 13 亿月活,底气在于“ 默认入口”,聊天记录里藏着最真实的意图数据。但微信的“ 克制” 文化让 AI 落地偏慢,隐私合规压力也让 Agent 不敢轻易读取上下文。此外,腾讯在端侧硬件和云模型上均不占优。
6 月 8 日,微信开放平台宣布面向小程序开发者开放 AI 生态接入,用户一句话即可调用小程序完成点咖啡、订机票等操作。携程、美团随即接入,腾讯股价次日涨超 4%。但开放的另一面是控制,自动模式下开发者交出的是数据控制权。生态的繁荣,取决于微信愿意在多大程度上让利。
四家中最像 Apple 的是华为。
鸿蒙 6 上线 80 余个应用智能体,小艺 Claw 具备深度记忆和跨设备协同能力,依托鸿蒙的分布式架构,Agent 可以在手机、平板、车机之间无缝流转。华为最大的武器是系统级权限,鸿蒙是自研操作系统,华为可以像 Apple 一样把 Agent 做进底层。但华为的致命伤是硬件出货量的天花板,受芯片供应限制,华为终端设备的规模远不及苹果的 25 亿台,这意味着 Agent 的“ 触点密度” 不够。没有足够的设备铺开,再好的系统级能力也只是空中楼阁。
用触点、上下文、权限三个维度来审视中国四强:

没有一家同时拿下三个维度,但每家都在自己的优势维度上构筑护城河。与美国市场不同的是,中国玩家之间的“ 墙” 更高,微信不会轻易让豆包读取聊天记录,抖音也不会向淘宝开放流量入口。这意味着中国 Agent 入口战争的终局,可能不是“ 一家通吃”,而是“ 各守一城”。
但核心挑战依然是权限壁垒,当一家 Agent 试图调用另一家的核心数据时,面临的是森严的商业护城河与严格的数据安全法规。这恰恰印证了入口战争的本质,谁能突破庭院深深的权限壁垒,谁就掌握了下一代分配权。
“ 失落的中间层”
四家巨头从不同方向切入入口战争,一个残酷的副产品正在浮现:当系统级 Agent 可直接调用底层 API,用户没有动力打开独立的 ChatGPT 或 Claude 网页版。缺乏自有入口的纯模型提供商和套壳应用,正遭遇严重的价值挤压。
这一幕似曾相识。PC 时代,微软将浏览器、媒体播放器、Office 捆绑进 Windows,一批独立软件开发商 (ISV) 就此消失。移动时代,苹果和 Google 的应用商店抽成 30%,挤压了靠分发生存的中间商。每一次计算平台迁移,都会清洗掉那些“ 寄生在别人生态上” 的中间层。这一次,清洗来得更快。
被挤压的中间层,处境各不相同。
最脆弱的是“ 纯套壳”。没有自研模型,没有独家数据,只是在 GPT 或 Claude 之上包一层 UI 再加点提示词工程。这类产品几乎没有切换成本,用户随时可以走。当系统级 Agent 原生具备同样的对话能力,它们第一个被淘汰。
“ 垂直 AI SaaS” 的处境稍好一些。它们瞄准医疗、法律、金融、教育等垂直场景,用专有数据微调模型,构建行业工作流,有场景绑定和数据壁垒,短期内不会被替代。但长期看,如果微软或谷歌在 Copilot 中内置了同样的行业模板,垂直 SaaS 的护城河就会快速收窄。它们被挤压的程度,取决于“ 行业数据的独占性” 有多强。
最尴尬的反而是“ 模型公司” 本身。OpenAI 建 GPT Store,Anthropic 推函数调用,都在试图从“ 卖智力” 转向“ 抢入口”。但尴尬的是,当 OS 级 Agent 可以直接调用 API,用户连 ChatGPT 网页版都不需要打开,GPT Store 里的插件又有多少打开率?模型公司向上抢入口,本质是在巨头的阴影下建一座自己的城堡。
这就引出了一个更深层的问题:开发者押注哪个平台?
Agent 生态的繁荣,取决于有多少开发者为它构建 Skill 和插件。如果开发者认定“ 未来属于微信 Agent”,他们就会优先为微信开发。如果认定“ 未来属于 Copilot”,就会优先接入微软生态。而开发者的选择又取决于用户在哪里。这是一个鸡生蛋蛋生鸡的循环,先打破循环的那家,将收割整个生态。
但开发者同样面临“ 平台锁定” 的风险。为微信开发 Agent Skill,和十年前为 iOS 开发 App 没有本质区别,平台规则一变,投入可能归零。经历过苹果抽成和谷歌 Play 封号的中国开发者,对此心有余悸。这反而催生了一个新的中间层机会:跨平台 Agent 中间件,让开发者一次构建、多平台分发。谁能解决“ 写一次,到处跑” 的问题,谁就可能成为 Agent 时代的“ 新 Android”。
未来生态大概率不会走向简单的“ 两极”,而是三层结构:极上层是把控入口的超级 Agent,攫取行业大部分利润。中间层是垂直行业 Agent 和跨平台中间件,靠数据壁垒和分发能力生存。极下层是提供算力与通用智力的基座大模型。
而连接所有层的基石,依然是信任。谁能用端侧加密、细粒度授权、一键撤销等设计让用户安心交出“ 执行权”,谁才能真正登顶。
AI 的终局,不是让机器更聪明地聊天,而是让机器代替人类去行动。未来的数字世界,不属于最会聊天的 AI,而属于最会做事的 AI。
(本文首发钛媒体 APP,作者 | 作者 | AGI-Signal,编辑 | 赵虹宇)
更多精彩内容,关注钛媒体微信号 (ID:taimeiti),或者下载钛媒体 App















