
12 月 9 日深夜,智谱开源了其核心 AI Agent 模型 AutoGLM,引发 AI 圈关注。
距离 AutoGLM 第一次出现在公众视野里,已经过去了 111 天。AutoGLM 是智谱 AI 开发的跨端通用智能体,通过自然语言指令自主完成手机、电脑等设备的复杂操作,实现“ 一句话搞定任务” 的人机交互体验。
作为全球一个具备“Phone Use” 能力的 AI Agent,AutoGLM 核心功能围绕“ 自主执行” 展开。它能模拟真人点击、滑动、输入等动作,稳定处理外卖点单、机票预订、朋友圈互动等数十步流程,覆盖 50 多个高频中文应用的核心场景,同时支持跨端协同 (手机+电脑),例如,手机发指令让电脑自动生成 PPT、整理数据,任务在云端运行,不占用本地设备资源。
2025 年 8 月,AutoGLM 2.0 面向公众开放,强调“ 执行型助手” 定位,不再局限于对话或信息查询,而是“ 动手” 完成任务,比如,办公场景中从检索资料到生成视频、PPT 的全流程执行,生活场景中跨应用预订服务等。
但是,由于三方功能的实际体验不够顺畅,在实际体验过程中,授权动作繁琐,语义理解易错等方面问题,让 AutoGLM 的首次亮相并未在 C 端引发现象级传播。
但其构建的新技术范式仍引发了行业震动。
智谱官方表示,这一次 AutoGLM 选择开源,主要基于三方面原因:
一是避免 AI 手机能力被少数厂商垄断,通过开放技术底座推动行业共建;
二是保护用户隐私,让数据与控制权完全归属使用方,支持私有化部署;
三是共享 32 个月的技术积累,降低 Agent 开发门槛。本次开源内容包含训练好的核心模型、Phone Use 能力框架、50+高频 App 的 Demo 及文档,均以 MIT 和 Apache-2.0 许可证开放。
据智谱官方,AutoGLM 开源的首要意义是对抗技术垄断,将“AI 使用手机” 这一核心能力基础设施化和民主化。
文档指出,如果“ 会用手机的 AI 能力” 只掌握在极少数厂商手中,用户的手机将越来越像“ 别人家的入口”,开发者的创新也会受制于人。通过开源,AutoGLM 将这项能力变为行业可以共同拥有和打磨的公共底座。
开源使得任何开发者或团队都能像使用“ 积木” 一样,将 AutoGLM 集成到自己的系统中,或进行拆解、重写和改造。这降低了 Agent 开发的门槛,可以催生出多样化的 AI 原生应用、硬件和解决方案,加速 Agent 生态的繁荣。

同时,基于 Phone Use 能力涉及的支付、社交、企业系统等敏感领域的问题,AutoGLM 团队强调,将控制权交还给用户,以此解决信任核心问题。团队明确表示,“ 不希望也不应该把这些东西握在自己手里”。
有行业人士对作者表示:“AutoGLM 开源的意义远超一个普通的代码开放项目。它是一次战略性的生态卡位和规则定义,其目标是成为未来 AI Agent,尤其是终端通用 Agent 的基础,就像 Android 之于移动应用生态。”
结合最近“ 豆包 AI 手机” 的热潮来看,智谱 AutoGLM 这次开源,也意味着各家公司在智能手机终端的通用 Agent 之争,正走上完全不同的道路。
而这两条路径,正好与多年之前的安卓与苹果之争十分类似。
从策略目标层面来看,AutoGLM 的策略,是成为 AI 时代的基础设施和公共底座,是一套类似于安卓的软件开发环境。而豆包手机助手的策略,是直接抢占硬件入口,通过“AI 附体手机” 的方式,抢占用户与数字世界交互的终端。
从 AI 能力部署层面来看,AutoGLM 采用“ 云端智能体” 范式,为 AI 配备专属的云手机、云电脑,任务在云端虚拟设备中执行,不占用、不干扰用户本地设备;豆包手机直接采用“ 终端具身智能” 范式,让 AI 直接在用户真实的物理手机上进行“ 模拟点击” 操作,并将 AI 能力深度集成到手机硬件和系统层,实现多任务并行。
智谱 AutoGLM 的开放模式将训练模型、能力框架等开源,将操作执行能力封装为 API,供开发者融入各类硬件;而豆包与手机厂商 (中兴努比亚) 合作,推出专属硬件,抢占用户终端,其“ 模拟点击、调度一切” 的模式,直接挑战了微信、淘宝等超级应用的生态壁垒和用户入口,因此,引发了平台的“ 封禁”。
智谱 AutoGLM 与豆包手机助手的路线分歧,某种程度上像是传统意义上软件与硬件谁来定义谁的问题,后续必定还有更多的玩家进入这场角力,而智谱 AutoGLM 这次开源,更像是通用 AI Agent 话语权之争的大幕拉开的一个重要信号。(作者|陶天宇,编辑|李程程)
更多精彩内容,关注钛媒体微信号 (ID:taimeiti),或者下载钛媒体 App















