2026 年 6 月 30 日星期二

登录
注册

周天财经

没有结果

查看所有结果

没有结果

查看所有结果

周天财经

没有结果

查看所有结果

首页商业

GPT-5.2 获封「最强打工人」，谷歌同日以 Gemini「性价比」系列应战

2025 年 12 月 12 日

在商业

阅读时间： 2 mins read

阅读：681

Related articles

美元指数破位下跌，新兴市场与大宗商品「弱美元」红利还能走多远？

读懂物理 AI：AI 产业的下半场，不止是概念狂欢

2026 年 6 月 30 日

纽娲机器人完成 5000 万元天使轮融资，押注机器人" 具行智能"｜融资速递

纽娲机器人完成 5000 万元天使轮融资，押注机器人" 具行智能"｜融资速递

2026 年 6 月 30 日

图片由 AI 生成

「我从未像现在这样对我们的研发和产品路线图，以及实现我们使命的整体方向感到如此乐观。」

12 月 12 日，在正式上线 GPT-5.2 的同时，OpenAI CEO 萨姆·奥尔特曼（Sam Altman）发布了一篇十周年纪念文章中这样说。

他极力向外界展现着自己依旧自信的一面。毕竟，虽然 GPT 大模型和 ChatGPT 聊天机器人至今仍是当前 AI 大潮的造浪者，但想必此刻，奥尔特曼感受到的竞争压力堪称空前。

今年以来，DeepSeek、Grok、Claude 等竞争者的强势追赶，尤其是谷歌上个月推出的 Gemini 3 大放异彩，都将 AI 大模型竞争推上了更新的高度。

最近，奥尔特曼先是在内部备忘录中提示员工，需要接受最好的大模型不出自家之手的事实，继而，又发出公司首个「红色警报」，强调「立即行动，集中所有资源夺回领先地位」。

截图来自社交平台 X

只有更强大的产品，才能支撑自信的底气。

在十周年纪念日这天，OpenAI 重磅发布预热了一周多的 GPT-5.2，评测表现再次反超所有竞争对手。

但谷歌不甘示弱，几乎在同一时间发布了新品，让这场大模型之争的战况再次升级。

GPT-5.2 获评「最强AI打工人」，但「工资」很高

GPT-5.2 此次仍然「全线出击」，一次性发布了 Instant、Thinking 和 Pro 三款不同层级的模型。

近一个月前 Gemini 3 发布时，其评测得分几乎「碾压」GPT-5 的表现引发市场巨大关注。

而这次，根据 OpenAI 发布的基准测试结果，GPT-5.2 实现了全面反超，其 Thinking 模型基准测试得分均高于 Gemini 3 PRO 和 Anthropic 的 Claude Opus 4.5。

其中，GPT-5.2 在博士级别的专家推理评估 GPQA Diamond 得分高达 92.4%，相比 GPT-5.1 Thinking 的 88.1% 和 Gemini 3 PRO 刚刚刷出的 91.9% 高分再进一步。在不用工具的情况下，GPT-5.2 在最新美国数学邀请赛（AIME2025）中拿到了满分。

OpenAI 尤其强调了 GPT-5.2 在专业工作方面的领先地位，称其 Thinking 模型是「目前最能够胜任现实中各类专业用途的模型」。

在用于评估专业型技能的 GDPval 测试中，该模型得到了 70.9% 的高分，比 GPT-5.1 Thinking 高了足足 32.1%，领先 Gemini 3 PRO 有 17.4%。此外，对比尤其擅长编程等企业工作，此前在该评估中更胜一筹的 Claude Opus 4.5，OpenAI 的新品也高出了 11.3%。

图片来自 OpenAI

OpenAI 给出的案例演示中，GPT-5.2 聚焦了制作表格、整理分析数据、制作项目流程图等十分落地的现实工作场景。

公司还表示，新模型在编写代码、制作 PPT、图像感知、理解长上下文、使用工具、处理复杂的多步骤项目方面都表现出色，而且错误率较前代产品大大减少。

模型发布后，GPT-5.2 在实际工作场景中的表现也确实获得了不少赞许，一些使用者给予了其「最强 AI 打工人」「职场最佳拍档」等称号。

不过，这个「打工人」的「高工资」可能会成为问题。

数据显示，在输入输出价格方面，GPT-5.2 要比前代贵了 40%，输入价格 21 美元，输出价格高达 168 美元。

这再次引发了一些担忧，此前，OpenAI 堆算力发展大模型的做法已经受到质疑，无论是 DeepSeek 还是 Gemini，似乎都证明着 AI 应用可以采取更具性价比的模式。

如果再考虑市场对以 OpenAI 和英伟达等引领的资本支出狂潮，以及市场对泡沫焦虑的警惕，GPT-5.2 是靠算力「硬怼」实现的反击，那这显然对奥尔特曼来说，也是个隐忧。

可以看到的是，一些用户在吐槽 Thinking 和 PRO 的应答时间明显较慢，比其前代产品还要慢。而对于逐渐嵌入日常生活、工作的 AI 产品来说，机会成本和效率显然已愈发重要。

普通即时版 GPT-5.2 仍然在一些常识问题上犯错，也引发了一些用户玩梗吐槽。

当然，OpenAI 的动作还没有结束。奥尔特曼表示，下周，会继续给用户带来「小圣诞礼物」，ChatGPT 的「成人模式」也预计将于明年一季度面世。

谷歌给 OpenAI 扔了个炸弹，提前 1 小时抢发 Gemini Deep Research

OpenAI 的劲敌们，早已准备好子弹，回击这次 GPT 的重要更新。

谷歌抢在 GPT-5.2 前一个小时左右进行了产品更新，称其深度研究智能体 Gemini Deep Research 全面增强，并首次向开发者开放，再次引发了关注，试图不让 OpenAI 独占「头条」。

据谷歌介绍，Gemini Deep Research 基于 Gemini 3 PRO 构建，通过多步强化学习训练，显著减少「幻觉」，在复杂研究任务中表现出更高精度。

在人类终极大考（HLE）中，Gemini Deep Research 得到 46.4% 分，比 GPT-5.2 Thinking 的 45.5% 要高，仅低于 GPT-5 Pro 的 50%。

图片来自谷歌

但是，其更大的优势在成本极低，谷歌产品经理透露，新版智能体在与 GPT-5 Pro 表现相当的同时，成本仅为后者的十分之一左右，展现出强大的性价比优势。

相对于 OpenAI，更好的性价比、另辟蹊径的训练模式、公司的现金流、自研专用芯片等，都是谷歌「逆袭」叙事的核心。

如今，在大模型比拼性能的同时，谷歌的核心优势仍在继续，这也持续为 OpenAI 带来压力。

此外，为科学评估研究型智能体的能力，谷歌还同步开源了基准测试工具 DeepSearchQA，包含覆盖 17 个领域的 900 项复杂任务。

当然，GPT-5.2 未必是奥尔特曼捍卫大模型王座的杀手锏。

此前有消息称，OpenAI 在加速开发自身全新的模型「Garlic」，致力于通过新的方式重建绝对领先的优势。谷歌、Anthropic 显然还会继续拿出更好的产品。而 Meta 和 DeepSeek 等竞争者也同样有着令人期待的新品可能面世。

大模型浪潮的另一大赢家英伟达，最近与美银举办了一次投资者线上交流会。英伟达方面提到，只依据 Gemini 3 的表现比 GPT5 更优，就认为谷歌自研的 TPU 要好于英伟达的 GPU 是不合理的。

尤其目前大部分的大模型都是用上一代 H 系列芯片训练的，用 Blackwell 训练的大模型要到 2026 年才会上线，其优势到时才会显现，更不用说还未投入使用的新一代超级芯片 Rubin。

市场对英伟达的说法看法不一，有观点认为模型强大与否与芯片代际不直接挂钩，也有观点认为更关键的还是性价比问题。不过，不管怎样，英伟达的说法已让明年的大模型之争看起来更值得期待了。

2025 年年末之际，AI 大模型之战和 AI 芯片之战的战局，都变得更加刺激，2026 年，想必战况还会继续升级。这场战事不仅是大模型能力之争，更是关系到大模型的训练、发展路径，以及 AI 芯片的未来之战。（作者｜胡珈萌，编辑｜李程程）

广告

相关文章

美元指数破位下跌，新兴市场与大宗商品「弱美元」红利还能走多远？

读懂物理 AI：AI 产业的下半场，不止是概念狂欢

来自周天财经

2026 年 6 月 30 日

（本文作者为山自，钛媒体经授权发布）文...

纽娲机器人完成 5000 万元天使轮融资，押注机器人" 具行智能"｜融资速递

纽娲机器人完成 5000 万元天使轮融资，押注机器人" 具行智能"｜融资速递

来自周天财经

2026 年 6 月 30 日

2026 年 6 月，纽娲机器人（Neo...

【钛晨报】国常会最新部署：要加力推进人工智能创新突破；美团、淘宝闪购、京东外卖达成共识；三星、SK海力士和美光在美遭集体诉讼

【钛晨报】国常会最新部署：要加力推进人工智能创新突破；美团、淘宝闪购、京东外卖达成共识；三星、SK 海力士和美光在美遭集体诉讼

来自周天财经

2026 年 6 月 30 日

【钛媒体综合】据新华社报道，国务院总理李...

液冷龙头成为「减持先锋」，业绩脸朝地，飞龙股份高位套现近5亿

液冷龙头成为「减持先锋」，业绩脸朝地，飞龙股份高位套现近 5 亿

来自周天财经

2026 年 6 月 30 日

图片系 AI 生成从汽车水泵到 AI 液冷的&l...

不缺客户的昆仑芯，为什么上市前要求投资者「捆绑式」采购芯片？

不缺客户的昆仑芯，为什么上市前要求投资者「捆绑式」采购芯片？

来自周天财经

2026 年 6 月 29 日

（本文作者为 TechPulse，钛媒体...

加载更多

投诉建议：+86 13326565461

© 2025 广州小舟天传媒有限公司 by 周天财经 - 粤 ICP 备 2025452169 号-1

没有结果

查看所有结果

首页

24 小时

世界

商业

基金

期货

股票

行业新闻

黄金

© 2025 广州小舟天传媒有限公司 by 周天财经 - 粤 ICP 备 2025452169 号-1

欢迎回来！

在下面登录您的帐户

记住我

忘记密码？注册

创建新帐户！

填写以下表格进行注册

所有项目需要填写。登录

重置您的密码

请输入您的用户名或电子邮件地址以重置密码。

登录

用户登录

手机号

密码

还没有账号？立即注册

用户注册

手机号

邮箱（可选）

密码

确认密码

已有账号？立即登录