2026 年 3 月 29 日 星期日
  • 登录
  • 注册
周天财经
广告
  • 首页
  • 24 小时
  • 世界
  • 商业
  • 基金
  • 期货
  • 股票
  • 行业新闻
  • 黄金
没有结果
查看所有结果
  • 首页
  • 24 小时
  • 世界
  • 商业
  • 基金
  • 期货
  • 股票
  • 行业新闻
  • 黄金
没有结果
查看所有结果
周天财经
没有结果
查看所有结果
首页 行业新闻

谷歌 Gemini 最 「小」 的一次迭代,姚顺宇为何高呼 「不可阻挡」?

2026 年 2 月 20 日
在 行业新闻
阅读时间: 2 mins read
阅读:1145
A A

Related articles

哈萨比斯为何能率领谷歌DeepMind反超OpenAI?

哈萨比斯为何能率领谷歌 DeepMind 反超 OpenAI?

2026 年 3 月 28 日
Anthropic泄露背后:AI安全承诺的破产与重构

Anthropic 泄露背后:AI 安全承诺的破产与重构

2026 年 3 月 28 日


文 | 字母 AI,作者 | 小金牙,编辑 | 王靖

人们还在津津乐道 OpenAI 和 Anthropic 两家公司的老板拒绝牵手,以至于握拳高举的滑稽画面,另一边,谷歌一个反手迭代了模型。

而且这次迭代,颇像是狼披上了羊皮——从模型后缀的数字序号看,这是谷歌最 「小」 的一次迭代,之前都是从 Gemini 2.0 到 Gemini 2.5 这样的迭代,这次从 Gemini 3.0 到 Gemini 3.1Pro Preview。

但是这 「.1」 的迭代,进步得却不是一星半点。

谷歌 CEO 皮查伊 (Sundar Pichai) 表示,新代模型非常擅长处理 「超级复杂的任务」。例如将复杂概念可视化、将数据综合成单一视图或者将创意项目变为现实。

姚顺宇也专门在 X 上发帖为 Gemini 3.1 Pro Preview 振臂,盛赞:

「Gemini 不仅仅是一个好模型,更好的模型正在以不可阻挡之势到来。」

需要注意的是,大约一周前,谷歌推出了 「专用推理模式」Gemini 3 Deep Think,专为科学、研究、工程等复杂、开放式问题设计。

Demini 3 Deep Think 是姚顺宇从 Anthropic 跳槽到谷歌 DeepMind 之后参与的第一个项目。

而如今的 Gemini 3.1 Pro Preview 和 Gemini 3 Deep Think 有千丝万缕的关系,官方表示 「直接构建在 Gemini 3 Deep Think 的经验和技术之上」。相当于把 Deep Think 的核心推理提升技术 「下放」 到更广泛可用的 Pro 模型中。

Gemini 3.1 Pro Preview 能做什么

既然这次新代模型的突出能力在处理 「超级复杂」 的任务,那么普通的对话放一边,谷歌的官方博文中,重点给出了几种示例秀肌肉。

第一,通过简单的提示词,创建 SVG 动画。

这个功能前代也有,但是对比之下进步明显。

比如提示词 「生成一个 SVG,描绘一只变色龙静静地坐在树枝上。让变色龙的眼睛跟随用户的鼠标光标在屏幕上移动。」

Gemini 3 Pro 生成的动画背景是单一的白色,变色龙也看起来很呆板,甚至一侧有两只眼睛。

Gemini 3.1 Pro 生成的动画则有丰富的 「深绿色丛林」 背景,变色龙身体有黄色斑纹和圆点装饰,眼睛立体,腿部姿势自然弯曲。

再比如提示词 「生成一个滑动切换开关的 SVG,当鼠标悬停在太阳图标上时,将其变成发光的月亮,同时背景从明亮平滑渐变到黑暗。采用干净的扁平 UI 风格。」

Gemini 3 Pro 给出的动画虽然完成了任务,图标可以随鼠标变化,但是主图标单一,是一个缺角的圆形图案,用黄色代表白天,白色代表夜间。

Gemini 3.1 Pro 生成的动画要复杂得多,白天是黄日白云,夜间是月牙繁星,两套图标丝滑变换。

总而言之,Gemini 3 Pro 做的动画,让人想起多年前那个 「学了三年动画」 的梗。

而 Gemini 3.1 Pro 交付的 SVG 动画,已经达到了可以直接使用的效果。

第二,构建工程级别系统。

Gemini 3.1 Pro 已经可以根据一段高复杂度的自然语言指令,直接生成一个集 3D 渲染、实时太阳星历计算、API 异步拉取和物理光效于一体的完整交互系统,而不是简单页面 demo。

谷歌给出的示例中,用户给出文字指令,Gemini 3.1 Pro 生成了构建一个高保真、可交互的 3D 国际空间站 (ISS) 轨道追踪器。使用高分辨率的 Blue Marble 纹理贴图渲染一个精细的 3D 地球模型。

第三,生成交互式创意系统。

在另一个示例中,谷歌展示了 Gemini 3.1 Pro 编写的一个复杂的 3D 椋鸟群舞 (murmuration) 模拟。

它不仅生成视觉代码,还构建了一个沉浸式体验,用户可以通过手部追踪操控鸟群,并聆听根据鸟群运动变化的生成式配乐。

对于研究人员和设计师而言,这提供了一种强有力的方式来原型化感官丰富的界面。

第四,将文学主题转化为可运行的代码。

这个示例可能是普通人也最容易 get 到厉害之处的一个。

当被要求为艾米莉·勃朗特 (Emily Brontë) 的 《呼啸山庄》(Wuthering Heights) 打造一个现代个人作品集网站时,该模型并未简单地总结文本内容,而是基于小说的氛围与情绪进行推理,设计出一个简洁、当代感十足的界面,创建出一个捕捉主人公精神内核的网站。

抽象推理,这种能力的含金量不用多说。

到底有多强?

新代模型免不了过一下刷榜这一步。

而 「.1」 的升级,获得了动辄倍数跃升的成绩。

根据谷歌官方博文放出的测试结果,

在 ARC-AGI-2 基准测试中,3.1 Pro 的验证得分达到了 77.1%。比 3 Pro 的推理性能提升了一倍以上。

这也符合 3.1 Pro 的示例,因为这个测试评估的是模型解决全新逻辑模式的能力。用人话说就是,抽象推理解谜的能力。

此外,在 GPQA Diamond(科学知识测试) 中,3.1 Pro 得分 94.3%;智能体类基准 MCP Atlas 上,得分 69.2%;真实网络浏览与信息整合能力的基准 BrowseComp 上,得分 85.9%。

这些成绩,均超过了 Anthropic 的 Sonnet 4.6、Opus 4.6,以及 OpenAI 的 GPT-5.2 与 GPT-5.3-Codex。

谷歌 Gemini 3.1 Pro 这次在 ARC 抽象推理和 BrowseComp 搜索任务上显著拉开差距,显示出明显的 Agent 倾向,而非单纯知识模型。

此外,专门做大模型基准测试与对比分析的第三方评测机构也发布了相关测试结果,大赞 Gemini 3.1 Pro 在构成 Artificial Analysis Intelligence Index 的 10 项评测中领先 6 项,相较于 Gemini 3 Pro Preview 在多项能力上显著提升,尤其是在推理与知识、代码能力以及降低幻觉方面进步最大。

而且,Gemini 3.1 Pro Preview 保持较高的 token 效率。

运行完整 Artificial Analysis Intelligence Index 约需 5700 万 token(比 Gemini 3 Pro Preview 多 100 万)。

这一 token 使用量低于其他在最大推理模式下运行的前沿模型,如 Opus 4.6(max) 和 GPT-5.2(xhigh)。

结合更低的单 token 定价,Gemini 3.1 Pro Preview 在前沿模型中具有成本优势,运行完整 Intelligence Index 的成本不到 Opus 4.6(max) 的一半,不过仍约为领先开源模型 GLM-5 的两倍。

能力翻倍价格不变

谷歌官方 API 定价显示,Gemini 3 Pro/3.1 Pro Preview 的收费结构是按 token 计费的:

小于 200k tokens 时,每百万 token 输入约 2 美元,输出价格为 4 美元。大于 200k tokens 时,每百万 token 输入 4 美元,输出 18 美元。

在上下文缓存方面,根据提示词规模,每百万 token 收取 0.20 至 0.40 美元,外加每小时每百万 token 4.50 美元的存储费。

这个价格,整体上和 Gemini 自己的上一代 3 Pro 一致,但要是和 Anthropic Opus 系列比起来,还是相对便宜的。 Opus 这类模型输入/输出单价能在 $5/$25 左右。

尤其是结合当下它在模型能力上相当突出,这个价格更显得极具竞争力。

不要忘了,谷歌这次发布的只是 「预览 (Preview)」,谷歌很快就会推出正式版。而 「.1」 的迭代,谷歌也是在暗示其只是小秀肌肉。

目前,开发者可以在 AI Studio、Gemini API、Gemini CLI、智能体开发平台 Google Antigravity 以及 Android Studio 使用 3.1 Pro;企业用户则可以在 Vertex AI 和 Gemini Enterprise 使用;普通用户在 Gemini 应用和 NotebookLM 都能用上,不过后者仅限 Pro 和 Ultra 订阅用户。

各个社区里已经有不少人迫不及待上手操作,真的就和谷歌的演示一样,手搓了不少惊艳的玩意。

有人用 Gemini 3.1 Pro 生成了一个可交互的 3D 机械级汽车悬架系统模拟器,包含真实几何结构、连杆约束与实时转向和行程计算,相当于把机械工程建模、物理逻辑和 3D 可视化一次性写成可运行工具,接近工程级原型能力。

有人用 3.1 Pro 制作 「捉鬼猎人走过一栋闹鬼的房子」 的循环动画,惊呼 「Gemini 没有开玩笑」。

总之,谷歌这回是真憋了个大招。

小小一个 「.1」,却把推理和代码能力拉得飞起,定价还这么稳。

社区里满溢的手搓 demo 的热情,也证明了它的能力与实用性。

AI 圈越来越现实了。模型再强,终究得看账单值不值。企业开始精打细算每个 token 的回报,开发者也得掂量掂量性价比。谷歌这一步,不仅是抢回王座,更是把竞争推向 「谁更会过日子」 的新阶段。

且看接下来,捏着拳头的 Anthropic 和 OpenAI,以及 xAI、Meta、微软等一众竞争对手该如何应对吧。

广告

相关 文章

哈萨比斯为何能率领谷歌DeepMind反超OpenAI?

哈萨比斯为何能率领谷歌 DeepMind 反超 OpenAI?

来自 周天财经
2026 年 3 月 28 日
0

文 | 字母 AI 谷歌与 OpenAI 围绕 A...

Anthropic泄露背后:AI安全承诺的破产与重构

Anthropic 泄露背后:AI 安全承诺的破产与重构

来自 周天财经
2026 年 3 月 28 日
0

文 | 舒书过去三天,Anthropic...

AI流量增速超人类8倍!流量「倒挂」前夜:AI智能体正掏空互联网的旧金矿

AI 流量增速超人类 8 倍!流量 「倒挂」 前夜:AI 智能体正掏空互联网的旧金矿

来自 周天财经
2026 年 3 月 28 日
0

Agentic Internet 来了。当...

司美格鲁肽仿制药之争:国内超 20 家药企竞速,靠什么笑到最后?

司美格鲁肽仿制药之争:国内超 20 家药企竞速,靠什么笑到最后?

来自 周天财经
2026 年 3 月 28 日
0

文 | 医药研究社就在前几天,医药圈迎来...

当激光雷达进入10万级,智驾溢价逻辑正在松动

当激光雷达进入 10 万级,智驾溢价逻辑正在松动

来自 周天财经
2026 年 3 月 28 日
0

零跑汽车创始人、董事长、CEO 朱江明过去...

加载更多
广告
  • 热门
  • 评论
  • 最新
神马经典投研: 集资讯、策略、研报一站式期货投研工具

神马经典投研: 集资讯、策略、研报一站式期货投研工具

2025 年 11 月 7 日
「我们也深陷残酷价格战」,德资巨头中国区高管警告

「我们也深陷残酷价格战」,德资巨头中国区高管警告

2025 年 8 月 4 日
一周产业基金|上海市人工智能CVC基金发布;湖北百亿人形机器人母基金来了

一周产业基金|上海市人工智能 CVC 基金发布;湖北百亿人形机器人母基金来了

2025 年 8 月 4 日
「硬科技」指数携手上涨,半导体设备ETF易方达(159558)、芯片ETF易方达(516350)等产品助力布局板块龙头

基民懵了!这个火爆的板块年内涨超 37%,主力却借道 ETF 狂抛逾 400 亿元

2025 年 9 月 20 日
Lesson 1: Basics Of Photography With Natural Lighting

The Single Most Important Thing You Need To Know About Success

4
Lesson 1: Basics Of Photography With Natural Lighting

Lesson 1: Basics Of Photography With Natural Lighting

3
Lesson 1: Basics Of Photography With Natural Lighting

5 Ways Animals Will Help You Get More Business

2
Lesson 1: Basics Of Photography With Natural Lighting

New Cryptocurrency That Will Kill Of Bitcoin

2

油价破百加息归零 黄金 4440 美元陷入双重拉扯

2026 年 3 月 28 日

头部基金代销机构 2025 成绩单出炉:蚂蚁营收破 200 亿元,「三巨头」 业绩全线增长

2026 年 3 月 28 日

惊弓心态何时休?美伊冲突收敛即是潜伏时机所在——极简投研

2026 年 3 月 28 日

原油危机 4 月 「全球大爆发」?小摩绘制 「时间表地图」:依次为亚非欧美!

2026 年 3 月 28 日
  • 隐私政策
  • 联系我们
  • 关于周天
  • 登录
  • 注册
投诉建议:+86 13326565461

© 2025 广州小舟天传媒有限公司 by 周天财经 - 粤 ICP 备 2025452169 号-1

没有结果
查看所有结果
  • 首页
  • 24 小时
  • 世界
  • 商业
  • 基金
  • 期货
  • 股票
  • 行业新闻
  • 黄金

© 2025 广州小舟天传媒有限公司 by 周天财经 - 粤 ICP 备 2025452169 号-1

欢迎回来!

在下面登录您的帐户

忘记密码? 注册

创建新帐户!

填写以下表格进行注册

所有项目需要填写。 登录

重置您的密码

请输入您的用户名或电子邮件地址以重置密码。

登录

用户登录

还没有账号?立即注册

用户注册

已有账号?立即登录