2026 年 4 月 9 日 星期四
  • 登录
  • 注册
周天财经
广告
  • 首页
  • 24 小时
  • 世界
  • 商业
  • 基金
  • 期货
  • 股票
  • 行业新闻
  • 黄金
没有结果
查看所有结果
  • 首页
  • 24 小时
  • 世界
  • 商业
  • 基金
  • 期货
  • 股票
  • 行业新闻
  • 黄金
没有结果
查看所有结果
周天财经
没有结果
查看所有结果
首页 商业

GPT-5.2 获封 「最强打工人」,谷歌同日以 Gemini「性价比」 系列应战

2025 年 12 月 12 日
在 商业
阅读时间: 2 mins read
阅读:680
A A

Related articles

秦安股份终止发行股份,计划现金购买亦高光电股权;安徽合力拟斥资2.74亿元关联收购江淮重工【并购一线】

1.24 亿抢科学家后,大厂盯上 13 岁 AI 产品经理

2026 年 4 月 9 日
超过Seedance的黑马,是「精心设计」的爆款?

超过 Seedance 的黑马,是 「精心设计」 的爆款?

2026 年 4 月 9 日


图片由AI生成

图片由 AI 生成

「我从未像现在这样对我们的研发和产品路线图,以及实现我们使命的整体方向感到如此乐观。」

12 月 12 日,在正式上线 GPT-5.2 的同时,OpenAI CEO 萨姆·奥尔特曼 (Sam Altman) 发布了一篇十周年纪念文章中这样说。

他极力向外界展现着自己依旧自信的一面。毕竟,虽然 GPT 大模型和 ChatGPT 聊天机器人至今仍是当前 AI 大潮的造浪者,但想必此刻,奥尔特曼感受到的竞争压力堪称空前。

今年以来,DeepSeek、Grok、Claude 等竞争者的强势追赶,尤其是谷歌上个月推出的 Gemini 3 大放异彩,都将 AI 大模型竞争推上了更新的高度。

最近,奥尔特曼先是在内部备忘录中提示员工,需要接受最好的大模型不出自家之手的事实,继而,又发出公司首个 「红色警报」,强调 「立即行动,集中所有资源夺回领先地位」。

截图来自社交平台X

截图来自社交平台 X

只有更强大的产品,才能支撑自信的底气。

在十周年纪念日这天,OpenAI 重磅发布预热了一周多的 GPT-5.2,评测表现再次反超所有竞争对手。

但谷歌不甘示弱,几乎在同一时间发布了新品,让这场大模型之争的战况再次升级。

GPT-5.2 获评 「最强AI打工人」,但 「工资」 很高

GPT-5.2 此次仍然 「全线出击」,一次性发布了 Instant、Thinking 和 Pro 三款不同层级的模型。

近一个月前 Gemini 3 发布时,其评测得分几乎 「碾压」GPT-5 的表现引发市场巨大关注。

而这次,根据 OpenAI 发布的基准测试结果,GPT-5.2 实现了全面反超,其 Thinking 模型基准测试得分均高于 Gemini 3 PRO 和 Anthropic 的 Claude Opus 4.5。

其中,GPT-5.2 在博士级别的专家推理评估 GPQA Diamond 得分高达 92.4%,相比 GPT-5.1 Thinking 的 88.1% 和 Gemini 3 PRO 刚刚刷出的 91.9% 高分再进一步。在不用工具的情况下,GPT-5.2 在最新美国数学邀请赛 (AIME2025) 中拿到了满分。

OpenAI 尤其强调了 GPT-5.2 在专业工作方面的领先地位,称其 Thinking 模型是 「目前最能够胜任现实中各类专业用途的模型」。

在用于评估专业型技能的 GDPval 测试中,该模型得到了 70.9% 的高分,比 GPT-5.1 Thinking 高了足足 32.1%,领先 Gemini 3 PRO 有 17.4%。此外,对比尤其擅长编程等企业工作,此前在该评估中更胜一筹的 Claude Opus 4.5,OpenAI 的新品也高出了 11.3%。

图片来自OpenAI

图片来自 OpenAI

OpenAI 给出的案例演示中,GPT-5.2 聚焦了制作表格、整理分析数据、制作项目流程图等十分落地的现实工作场景。

公司还表示,新模型在编写代码、制作 PPT、图像感知、理解长上下文、使用工具、处理复杂的多步骤项目方面都表现出色,而且错误率较前代产品大大减少。

模型发布后,GPT-5.2 在实际工作场景中的表现也确实获得了不少赞许,一些使用者给予了其 「最强 AI 打工人」「职场最佳拍档」 等称号。

不过,这个 「打工人」 的 「高工资」 可能会成为问题。

数据显示,在输入输出价格方面,GPT-5.2 要比前代贵了 40%,输入价格 21 美元,输出价格高达 168 美元。

这再次引发了一些担忧,此前,OpenAI 堆算力发展大模型的做法已经受到质疑,无论是 DeepSeek 还是 Gemini,似乎都证明着 AI 应用可以采取更具性价比的模式。

如果再考虑市场对以 OpenAI 和英伟达等引领的资本支出狂潮,以及市场对泡沫焦虑的警惕,GPT-5.2 是靠算力 「硬怼」 实现的反击,那这显然对奥尔特曼来说,也是个隐忧。

可以看到的是,一些用户在吐槽 Thinking 和 PRO 的应答时间明显较慢,比其前代产品还要慢。而对于逐渐嵌入日常生活、工作的 AI 产品来说,机会成本和效率显然已愈发重要。

普通即时版 GPT-5.2 仍然在一些常识问题上犯错,也引发了一些用户玩梗吐槽。

当然,OpenAI 的动作还没有结束。奥尔特曼表示,下周,会继续给用户带来 「小圣诞礼物」,ChatGPT 的 「成人模式」 也预计将于明年一季度面世。

谷歌给 OpenAI 扔了个炸弹,提前 1 小时抢发 Gemini Deep Research

OpenAI 的劲敌们,早已准备好子弹,回击这次 GPT 的重要更新。

谷歌抢在 GPT-5.2 前一个小时左右进行了产品更新,称其深度研究智能体 Gemini Deep Research 全面增强,并首次向开发者开放,再次引发了关注,试图不让 OpenAI 独占 「头条」。

据谷歌介绍,Gemini Deep Research 基于 Gemini 3 PRO 构建,通过多步强化学习训练,显著减少 「幻觉」,在复杂研究任务中表现出更高精度。

在人类终极大考 (HLE) 中,Gemini Deep Research 得到 46.4% 分,比 GPT-5.2 Thinking 的 45.5% 要高,仅低于 GPT-5 Pro 的 50%。

图片来自谷歌

图片来自谷歌

但是,其更大的优势在成本极低,谷歌产品经理透露,新版智能体在与 GPT-5 Pro 表现相当的同时,成本仅为后者的十分之一左右,展现出强大的性价比优势。

相对于 OpenAI,更好的性价比、另辟蹊径的训练模式、公司的现金流、自研专用芯片等,都是谷歌 「逆袭」 叙事的核心。

如今,在大模型比拼性能的同时,谷歌的核心优势仍在继续,这也持续为 OpenAI 带来压力。

此外,为科学评估研究型智能体的能力,谷歌还同步开源了基准测试工具 DeepSearchQA,包含覆盖 17 个领域的 900 项复杂任务。

当然,GPT-5.2 未必是奥尔特曼捍卫大模型王座的杀手锏。

此前有消息称,OpenAI 在加速开发自身全新的模型 「Garlic」,致力于通过新的方式重建绝对领先的优势。谷歌、Anthropic 显然还会继续拿出更好的产品。而 Meta 和 DeepSeek 等竞争者也同样有着令人期待的新品可能面世。

大模型浪潮的另一大赢家英伟达,最近与美银举办了一次投资者线上交流会。英伟达方面提到,只依据 Gemini 3 的表现比 GPT5 更优,就认为谷歌自研的 TPU 要好于英伟达的 GPU 是不合理的。

尤其目前大部分的大模型都是用上一代 H 系列芯片训练的,用 Blackwell 训练的大模型要到 2026 年才会上线,其优势到时才会显现,更不用说还未投入使用的新一代超级芯片 Rubin。

市场对英伟达的说法看法不一,有观点认为模型强大与否与芯片代际不直接挂钩,也有观点认为更关键的还是性价比问题。不过,不管怎样,英伟达的说法已让明年的大模型之争看起来更值得期待了。

2025 年年末之际,AI 大模型之战和 AI 芯片之战的战局,都变得更加刺激,2026 年,想必战况还会继续升级。这场战事不仅是大模型能力之争,更是关系到大模型的训练、发展路径,以及 AI 芯片的未来之战。(作者|胡珈萌,编辑|李程程)

广告

相关 文章

秦安股份终止发行股份,计划现金购买亦高光电股权;安徽合力拟斥资2.74亿元关联收购江淮重工【并购一线】

1.24 亿抢科学家后,大厂盯上 13 岁 AI 产品经理

来自 周天财经
2026 年 4 月 9 日
0

(本文作者为 融中财经,钛媒体经授权发布...

超过Seedance的黑马,是「精心设计」的爆款?

超过 Seedance 的黑马,是 「精心设计」 的爆款?

来自 周天财经
2026 年 4 月 9 日
0

(本文作者为 有界 UnKnown,钛媒体...

200亿,北京将要冲出一个航天独角兽IPO

谁在批量制造 「假洋牌」?

来自 周天财经
2026 年 4 月 9 日
0

(本文作者为 人间像素,钛媒体经授权发布...

芯片出海,征服日本汽车?

芯片出海,征服日本汽车?

来自 周天财经
2026 年 4 月 9 日
0

(本文作者为 锌刻度,钛媒体经授权发布)...

Apple Grapples With AI Talent Exodus as Tech Giants Compete for Top Researchers

Digital Quant 2026 量化交易大赛总交易量破 48M 美金,27 支队伍参赛,「人虾对决」 升温

来自 周天财经
2026 年 4 月 9 日
0

(本文作者为 Barrons 巴伦,钛媒体...

加载更多
广告
  • 热门
  • 评论
  • 最新
神马经典投研: 集资讯、策略、研报一站式期货投研工具

神马经典投研: 集资讯、策略、研报一站式期货投研工具

2025 年 11 月 7 日
「我们也深陷残酷价格战」,德资巨头中国区高管警告

「我们也深陷残酷价格战」,德资巨头中国区高管警告

2025 年 8 月 4 日
一周产业基金|上海市人工智能CVC基金发布;湖北百亿人形机器人母基金来了

一周产业基金|上海市人工智能 CVC 基金发布;湖北百亿人形机器人母基金来了

2025 年 8 月 4 日
「硬科技」指数携手上涨,半导体设备ETF易方达(159558)、芯片ETF易方达(516350)等产品助力布局板块龙头

基民懵了!这个火爆的板块年内涨超 37%,主力却借道 ETF 狂抛逾 400 亿元

2025 年 9 月 20 日
Lesson 1: Basics Of Photography With Natural Lighting

The Single Most Important Thing You Need To Know About Success

4
Lesson 1: Basics Of Photography With Natural Lighting

Lesson 1: Basics Of Photography With Natural Lighting

3
Lesson 1: Basics Of Photography With Natural Lighting

5 Ways Animals Will Help You Get More Business

2
Lesson 1: Basics Of Photography With Natural Lighting

New Cryptocurrency That Will Kill Of Bitcoin

2
资管周报:多家银行调降存款挂牌利率,最高下调35BP;26家理财公司2025年权益投资超5000亿

资管周报:多家银行调降存款挂牌利率,最高下调 35BP;26 家理财公司 2025 年权益投资超 5000 亿

2026 年 4 月 9 日
SpaceX 的挑战者们:贝索斯和中国军团们追得上吗?

SpaceX 的挑战者们:贝索斯和中国军团们追得上吗?

2026 年 4 月 9 日

金砖国家抢购黄金纸黄金大涨 2.62%

2026 年 4 月 9 日
英特尔4月24日凌晨发布一季度财报 营收有望与去年同期相当

英特尔 4 月 24 日凌晨发布一季度财报 营收有望与去年同期相当

2026 年 4 月 9 日
  • 隐私政策
  • 联系我们
  • 关于周天
  • 登录
  • 注册
投诉建议:+86 13326565461

© 2025 广州小舟天传媒有限公司 by 周天财经 - 粤 ICP 备 2025452169 号-1

没有结果
查看所有结果
  • 首页
  • 24 小时
  • 世界
  • 商业
  • 基金
  • 期货
  • 股票
  • 行业新闻
  • 黄金

© 2025 广州小舟天传媒有限公司 by 周天财经 - 粤 ICP 备 2025452169 号-1

欢迎回来!

在下面登录您的帐户

忘记密码? 注册

创建新帐户!

填写以下表格进行注册

所有项目需要填写。 登录

重置您的密码

请输入您的用户名或电子邮件地址以重置密码。

登录

用户登录

还没有账号?立即注册

用户注册

已有账号?立即登录