2026 年 5 月 20 日星期三

登录
注册

周天财经

没有结果

查看所有结果

没有结果

查看所有结果

周天财经

没有结果

查看所有结果

首页黄金

谷歌发布旗舰多模态大模型 Gemini Omni 可实现「任意输入、任意输出」能力

2026 年 5 月 20 日

在黄金

阅读时间： 1 min read

阅读：835

【TechWeb】5 月 20 日消息，今日凌晨，在谷歌 2026 I/O 开发者大会上，官方正式发布全新旗舰级多模态大模型 Gemini Omni。

据了解，Gemini Omni 主打「任意输入、任意输出」的核心能力，打破传统 AI 模态割裂局限，实现文本、图像、音频、视频等全模态信息的互通理解与自由生成。

据官方介绍，Gemini Omni 依托谷歌成熟的世界模型 Genie、图像模型 Nano Banana、视频生成模型 Veo 三大核心技术底座，构建起完整的全模态 AI 框架。

该模型支持多样化混合输入，用户可将手绘草图、文字描述、图片素材、音频视频等任意形式内容组合输入模型，系统可自主解析信息逻辑、模拟真实物理规则，最终生成高精度、符合现实逻辑的视频、图像、文本等多元化输出内容。

本次发布最大的实用化亮点在于对话式实时编辑能力。不同于传统 AI 生成工具一次性输出、修改繁琐的痛点，Gemini Omni 支持生成过程中的交互式迭代优化。用户完成初始内容生成后，可通过自然语言对话精准调整画面细节，例如替换视频场景、修改物体材质、调整动态特效，且修改过程不会破坏画面原有整体逻辑与物理效果。

发布会现场演示中，工作人员仅凭手绘简易图形+文字指令，便生成了带有物理碰撞效果的完整特效视频，直观展现了模型的强大创作能力。

广告

【TechWeb】5 月 20 日消息，今日凌晨，在谷歌 2026 I/O 开发者大会上，官方正式发布全新旗舰级多模态大模型 Gemini Omni。

据了解，Gemini Omni 主打「任意输入、任意输出」的核心能力，打破传统 AI 模态割裂局限，实现文本、图像、音频、视频等全模态信息的互通理解与自由生成。

据官方介绍，Gemini Omni 依托谷歌成熟的世界模型 Genie、图像模型 Nano Banana、视频生成模型 Veo 三大核心技术底座，构建起完整的全模态 AI 框架。

该模型支持多样化混合输入，用户可将手绘草图、文字描述、图片素材、音频视频等任意形式内容组合输入模型，系统可自主解析信息逻辑、模拟真实物理规则，最终生成高精度、符合现实逻辑的视频、图像、文本等多元化输出内容。

本次发布最大的实用化亮点在于对话式实时编辑能力。不同于传统 AI 生成工具一次性输出、修改繁琐的痛点，Gemini Omni 支持生成过程中的交互式迭代优化。用户完成初始内容生成后，可通过自然语言对话精准调整画面细节，例如替换视频场景、修改物体材质、调整动态特效，且修改过程不会破坏画面原有整体逻辑与物理效果。

发布会现场演示中，工作人员仅凭手绘简易图形+文字指令，便生成了带有物理碰撞效果的完整特效视频，直观展现了模型的强大创作能力。

Related articles

第 19 届杭州亚运会纪念币金银套多少钱 (2026 年 5 月 14 日)

2026 年 5 月 20 日

第 19 届杭州亚运会纪念币全套多少钱 (2026 年 5 月 14 日)

2026 年 5 月 20 日

【TechWeb】5 月 20 日消息，今日凌晨，在谷歌 2026 I/O 开发者大会上，官方正式发布全新旗舰级多模态大模型 Gemini Omni。

据了解，Gemini Omni 主打「任意输入、任意输出」的核心能力，打破传统 AI 模态割裂局限，实现文本、图像、音频、视频等全模态信息的互通理解与自由生成。

据官方介绍，Gemini Omni 依托谷歌成熟的世界模型 Genie、图像模型 Nano Banana、视频生成模型 Veo 三大核心技术底座，构建起完整的全模态 AI 框架。

该模型支持多样化混合输入，用户可将手绘草图、文字描述、图片素材、音频视频等任意形式内容组合输入模型，系统可自主解析信息逻辑、模拟真实物理规则，最终生成高精度、符合现实逻辑的视频、图像、文本等多元化输出内容。

本次发布最大的实用化亮点在于对话式实时编辑能力。不同于传统 AI 生成工具一次性输出、修改繁琐的痛点，Gemini Omni 支持生成过程中的交互式迭代优化。用户完成初始内容生成后，可通过自然语言对话精准调整画面细节，例如替换视频场景、修改物体材质、调整动态特效，且修改过程不会破坏画面原有整体逻辑与物理效果。

发布会现场演示中，工作人员仅凭手绘简易图形+文字指令，便生成了带有物理碰撞效果的完整特效视频，直观展现了模型的强大创作能力。

广告

【TechWeb】5 月 20 日消息，今日凌晨，在谷歌 2026 I/O 开发者大会上，官方正式发布全新旗舰级多模态大模型 Gemini Omni。

据了解，Gemini Omni 主打「任意输入、任意输出」的核心能力，打破传统 AI 模态割裂局限，实现文本、图像、音频、视频等全模态信息的互通理解与自由生成。

据官方介绍，Gemini Omni 依托谷歌成熟的世界模型 Genie、图像模型 Nano Banana、视频生成模型 Veo 三大核心技术底座，构建起完整的全模态 AI 框架。

该模型支持多样化混合输入，用户可将手绘草图、文字描述、图片素材、音频视频等任意形式内容组合输入模型，系统可自主解析信息逻辑、模拟真实物理规则，最终生成高精度、符合现实逻辑的视频、图像、文本等多元化输出内容。

本次发布最大的实用化亮点在于对话式实时编辑能力。不同于传统 AI 生成工具一次性输出、修改繁琐的痛点，Gemini Omni 支持生成过程中的交互式迭代优化。用户完成初始内容生成后，可通过自然语言对话精准调整画面细节，例如替换视频场景、修改物体材质、调整动态特效，且修改过程不会破坏画面原有整体逻辑与物理效果。

发布会现场演示中，工作人员仅凭手绘简易图形+文字指令，便生成了带有物理碰撞效果的完整特效视频，直观展现了模型的强大创作能力。

相关文章

第 19 届杭州亚运会纪念币金银套多少钱 (2026 年 5 月 14 日)

来自周天财经

2026 年 5 月 20 日

金投网提供第 19 届杭州亚运会纪念币金银套...

第 19 届杭州亚运会纪念币全套多少钱 (2026 年 5 月 14 日)

来自周天财经

2026 年 5 月 20 日

金投网提供第 19 届杭州亚运会纪念币全套多...

PPI 炸裂 6.0% 竟挡不住黄金？地缘火药桶把 4700 美元烧成新起点

来自周天财经

2026 年 5 月 20 日

周四（5 月 14 日）亚洲时段，金价多头势头...

本周最大变数即将落地金银上演王者之争

来自周天财经

2026 年 5 月 20 日

今日周四（5 月 14 日）亚盘时段，现货黄金...

美国 4 月 PPI 数据高于预期金价止跌反弹重回正区间

来自周天财经

2026 年 5 月 20 日

美国 4 月 PPI 数据高于预期金价止跌反弹...

加载更多

投诉建议：+86 13326565461

© 2025 广州小舟天传媒有限公司 by 周天财经 - 粤 ICP 备 2025452169 号-1

没有结果

查看所有结果

首页

24 小时

世界

商业

基金

期货

股票

行业新闻

黄金

© 2025 广州小舟天传媒有限公司 by 周天财经 - 粤 ICP 备 2025452169 号-1

欢迎回来！

在下面登录您的帐户

记住我

忘记密码？注册

创建新帐户！

填写以下表格进行注册

所有项目需要填写。登录

重置您的密码

请输入您的用户名或电子邮件地址以重置密码。

登录

用户登录

手机号

密码

还没有账号？立即注册

用户注册

手机号

邮箱（可选）

密码

确认密码

已有账号？立即登录