
图片系 AI 生成
日前,AI 领域投资人、风投公司 Air Street Capital 联合创始人内森· 贝奈奇 (Nathan Benaich) 与其团队共同发布了 《人工智能现状报告 2025》。该系列报告已连续发布八年,而本次报告长达 300 多页,由业界和研究领域的顶尖 AI 从业者进行评审,涵盖了技术研究与产业、政策与安全、用户市场调研等多个维度。
基于此,内森· 贝奈奇对下一年度给出预测,他在报告中写道:“ 对前沿 AI 模型的研究,中国的研究机构会超越美国;开放式 AI 智能体 (Agent) 更值得获得进一步科研发现;AI 安全领域,基于 AI 生成欺诈视频的网络攻击事件将引发国际间讨论;美国某头部 AI 研究架构会最终转向开源生态以获得其政府支持。”
笔者根据该报告调研数据及分析,梳理出三大类关键信息。
过去一年,超级智能与中美大模型 PK
2024 年末至 2025 年,随着 GPT-o1 的发布,迎来基于深度推理的大模型发展热潮,各家大模型厂商快速面世了多个推理模型。
期间,以 Meta 为代表的科技巨头定义了“ 超级人工智能”(Superintelligence) 一词,“ 通用人工智能”(AGI) 成为过去时。

请输入图说
报告认为,开源模型与闭源模型之间的差距虽曾一度缩小,但当前最顶尖的模型仍保持闭源,如 GPT-5、GPT-o3、Gemini 2.5 Pro、Claude 4.1 Opus、Grok4 等。其中,OpenAI 凭借其最新的 GPT-5 在多个基准测试中保持领先,继续巩固在基础模型领域的优势地位。
尽管中国基础模型尚未取得突破性进展,但在开源模型领域却颇具竞争力。相比之下,美国的开源模型表现令人失望,OpenAI 的开源模型性能远逊于 GPT-5。
随着中国 DeepSeek、Qwen 和 Kimi 等模型的崛起,市场竞争愈发激烈。特别是在推理和编程任务方面,中国厂商正逐步缩小与领先者的差距。报告强调,开源为中国厂商提供了快速追赶的契机,越来越多的开发者选择基于 Qwen 进行开发。中国的大模型不仅在智能水平上有所提升,还呈现出多样化的特点。相比之下,曾作为开源模型标杆的 Meta Llama,其市场份额已从 2024 年末的约 50% 大幅下滑至目前的 15%。

报告指出,近期推理模型的方法改进完全处于基准模型的误差范围内,这或许意味着推理模型的进步并不真实。而且,强化学习 (RL) 带来的实际收益也微乎其微,且容易过拟合。
针对此,报告援引一篇论文,深入剖析了研究人员间的争议焦点:推理模型在应对复杂问题时表现欠佳,究竟是源于实验设计本身的缺陷,还是仅在特定领域才能展现出超越基准模型的优势?
当前,前沿 AI 实验室正积极探索将强化学习、基于可验证的奖励机制、可验证推理与新环境相结合,赋予模型规划、反馈、自我修正以及在更长时间跨度内执行任务的能力。
报告还提到,AI 研究目前正考虑利用小语言模型 (SLMs) 构建智能体 (Agentic AI)。鉴于大多数智能体的工作流存在局限性、重复性且高度依赖格式,小语言模型已能满足实际操作需求,且成本显著降低。因此,采用小语言模型构建有限的异构智能体架构,仅在必要时调用大模型,成为一种可行的策略。

作为构建 AI 智能体的软件平台,AI 智能体框架发展同样迅速。尽管 LangChain 仍广受欢迎,但如今已只是众多选择之一,目前市面上各细分领域已涌现数十种框架,如研发领域的 AutoGen、camel,软件工程领域的 MetaGPT 等。
此外,AI 智能体的研究正赋予其记忆能力,实现从拓展上下文窗口到结构化、持久性终身记忆的转变,并且进一步延伸至动态整合、遗忘和反思,旨在使智能体在交互、任务乃至整个运行周期中保持连贯性。
报告还提到,AI 如今在跨学科领域的应用价值日益凸显。例如,在生物领域,DeepMind 的 AI 系统“Co-scientist”,基于 Gemini 2.0 构建,能够生成、辩论并进化其假设生成与实验规划过程。
AI 智能同样涌现物理世界。如艾伦人工智能研究所 Ai2 发布的针对于具身智能系统的模型 MolmoAct,谷歌的 Gemini Robotics 1.5,与大模型“ 思维链” 相呼应,能够显著提升物理机器人的可解释性和可靠性。
产业进展:更便宜的智能,限制与竞争
当前,AI 产业应用正迅速普及。AI 优先企业营收远超其 SaaS 同行,并且在各个行业展现出发展势头。2025 年,随着 AI 采用率上升,用户留存率上升,企业支出增加。特别是在音视频、虚拟形象、图像生成领域,AI 公司的收入有望实现爆发式增长。

在企业内部,AI 应用场景以内容生成、代码生成、研究及分析密集型任务最为常见。
ChatGPT、Claude、Gemini/Google 和 Perplexity 成为使用频率最高的工具。尽管 Meta 的 AI 工具覆盖面广,但其使用频率远不及 Mistral Le Chat 或 Midjourney。值得注意的是,DeepSeek 虽然覆盖率略低,但使用频率相对较高。
在开发者工具方面,Cursor、Claude Code 和 GitHub Copilot 备受青睐;而在非编程工具中,Deep Research、ChatGPT、ElevenLabs、Perplexity 和 Claude 的使用频率也非常高。


然而,AI 编程工具的应用也伴随着一定风险。例如,AI 编程工具可能会主动覆盖企业生产代码,导致开发成果受损。同时,从事 AI 编程开发的初创公司仍面临严峻的单位经济效益挑战,其盈利状况受制于上游模型价格和竞争对手。这可能导致初创公司在提高利润时,除了技术降本外,还可能采取突然提价或限制用户功能等措施。
浏览器正成为 AI 应用的最新焦点和企业竞争的新战场。目前,OpenAI、Google、Anthropico 和 Perplexity 均推出了助手功能,不仅能解答用户关于网页内容的问题,还能代表用户在浏览器中进行导航和操作。这一转变将浏览器重新定义为互联网的智能操作系统。此外,谷歌公司在其产品中嵌入 Gemini 能力,让更多用户体验到 AI 检索服务。据谷歌公司声称,其每月 Token 消耗数量在 2025 年同比增长了 50 倍,达到千万亿个 Token。
事实上,AI 的工业时代已经到来。
但在这其中,电力供应正成为制约 AI 发展的新因素。报告称,若电力供应不足,国家 AI 计划将面临崩溃风险。未来 1-3 年内,美国几个主要地区可能会出现电力短缺。美国能源部 (DOE) 警告称,由于电力供应不稳定和 AI 需求增长,到 2030 年,停电频率可能会增加 100 倍。
报告提到了 2024 年末 DeepSeek 对整个 AI 市场的搅动,市场重新认识“ 杰文斯悖论”,即更便宜的智能,带来更高的需求,更高的需求又会提高对芯片的消耗。

无论是在公有云、私有云还是本地化部署环境中,GPU 都至关重要。英伟达的市值突破 4 万亿美元,占据 90% 的 AI 研究论文市场份额,定制芯片与新云服务同步崛起。除了英伟达之外,随着客户对优惠价格、灵活合同条款及 AI 专用软件套件的需求增加,上市公司 Coreweave、Nebius 以及私企 Lambda、Crusoe 正实现快速增长。同时,报告指出 TPU 和 AMD 的 GPU 普及程度并不高。
报告还首次对 1183 名 AI 从业者进行了调研,结果显示,95% 的专业人士现在在工作或生活中使用 AI,76% 的人自掏腰包购买 AI 工具,且大多数人表示生产力持续提高。这充分证明 AI 的真正普及已成为主流趋势。
报告指出,目前 AI 主要挤压的是入门级岗位市场,其中在软件和客服领域,这类岗位极易受 AI 技术影响,其招聘岗位持续下降,经验丰富的劳动力暂时保持工作稳定性。

报告还指出,研究发现当前劳动力市场变化早于 2022 年 ChatGPT 的问世,AI 自动化目前并未削弱经济领域对认知型劳动力的需求。
AI 政策“ 反复”,安全风险加剧
整体来看,美国推行“ 美国 AI 优先” 的战略并调整出口政策,中国则加速推进自主研发与本土芯片制造,以中美为代表的 AI 竞赛愈演愈烈。
2025 年,特朗普政府将人工智能安全研究所更名为人工智能标准与创新中心 (CAISI),并启动了 5000 亿美元的“ 星门计划”。与此同时,美国政府发布 《人工智能行动计划》 力求保持其在全球 AI 领域的主导地位。
与中国最密切相关的是 AI 芯片出口限制的相关政策,报告用“ 反复” 来形容。事实上,美国政府在国家安全目标与供应链依赖、供应商游说这见寻求平衡,这使得英伟达和 AMD 成为政治焦点。报告指出,英伟达在中国市场并未达到稳定状态。

与此同时,美国监管措施在巨额投资浪潮中被边缘化:国际外交陷入僵局,《人工智能法案》 实施遭遇重重阻碍。
AI 数据中心建设陷入了新的瓶颈:邻避主义 (NIMBYism)。在最新事件中,美国公众对新建大规模数据中心的反对声日益高涨。
而尽管政府 《人工智能行动计划》 提及需自主 AI 领域” 基础科学“,但其核心研发资金远低于专家建议的 2026 年 320 亿美元投资目标。
与此同时,硅谷科技巨头目前采取了“ 逆向” 并购政策:通过快速引进人才 (创始人及团队高薪) 以规避并购限制,同时保留原业务精简的公司转型拓展小众市场。其原因在于,特朗普政府以来的并购增长预期尚未到来,同时又受制于前拜登政府推行的反垄断审查。例如,微软收购 Inflection,谷歌收购 Character AI,亚马逊收购 Adept,Meta 收购 Scale AI(貌似最近的 Manus 并购案也存在同样模式)。

目前美国联邦贸易委员会 (FTC) 对这类“ 逆向” 并购行为的担忧日益加剧。
与此同时,美国就 AI 安全相关的政策议题也在发生转变,加之实验室间日益激烈的商业竞争,某些安全规程已被列为非优先事项。
外部安全机构年度预算甚至不及顶尖实验室单日总支出,曾以安全为核心的机构开始将重点转向产品化。报告估算,外部 AI 安全研究投入仅约 1.3 亿美元,而同期全球 AI 研发支出接近千亿美元,比例极低。
AI 实验室为防范生物安全风险和网络攻击部署了空前防护,部分实验室却因错过自我设定的截止日期或悄然放弃测试方案。

报告指出,网络攻击能力每五个月翻一番,远超防御措施的更新速度。犯罪分子利用 AI 智能体的勒索软件已渗透至世界 500 强企业。
涉及生成式 AI 的安全事件正呈急剧增长态势。其中,大量报告事件涉及 AI 换脸技术,这与大模型的滥用密切相关。与此同时,AI 代理正日益成为网络安全防御的重大挑战。(作者 | 杨丽,编辑 | 盖虹达)
报告来源:https://www.stateof.ai/
更多精彩内容,关注钛媒体微信号 (ID:taimeiti),或者下载钛媒体 App















