原文:Google Unveils Gemini Omni—A Next-Gen AI Video Builder That Can 'Simulate the World'
将 Decrypt 添加为您的首选来源,以便在 Google 上查看我们的更多故事。
简而言之,Google 在 I/O 2026 上推出了 Gemini Omni,作为一种多模式 AI 模型,旨在从几乎任何输入生成视频和其他媒体。
DeepMind 首席执行官 Demis Hassabis 表示,Gemini Omni 将 Gemini 与 Veo、Nano Banana 和 Genie 等媒体生成模型相结合。
Gemini Omni Flash 首先通过 Flow 和 Flow Music 面向 Google AI 订阅者推出。
谷歌周二推出了 Gemini Omni,这是一种新的多模式人工智能模型,它将该公司的 Gemini AI 模型与其媒体生成工具(包括 Veo、Nano Banana 和 Genie)结合起来。
这一消息是在 Google I/O 2026 期间发布的,DeepMind 首席执行官 Demis Hassabis 将 Gemini Omni 描述为“我们的新模型,可以根据任何输入创建任何内容。”
哈萨比斯说:“它将 Gemini 的智慧与我们最好的生成媒体模型结合起来,将世界理解、多模态和编辑提升到了新的水平。”
谷歌表示,第一个版本 Gemini Omni Flash 将通过该公司的人工智能电影制作平台 Flow 和专注于人工智能辅助音乐创作的 Flow Music 推出。
我们将放弃 Gemini Omni:我们迈向可以从任何东西创建任何东西的模型的第一步 - 从视频开始。它将 Gemini 的智能与我们的生成媒体系统相结合 - 代表了世界理解、多模态和编辑方面的飞跃 🧵 pic.twitter.com/GAtqzr0VIV — Google DeepMind (@GoogleDeepMind) 2026 年 5 月 19 日
哈萨比斯称 Omni 是“迈向通用人工智能的一步”,他表示谷歌在过去的一年里将 Gemini 扩展为“一个可以理解和模拟世界的世界模型人工智能”。
谷歌推出的 Omni 建立在 Nano Banana 的流行基础上,Nano Banana 是该公司早期的人工智能图像编辑模型,去年 9 月帮助 Gemini 登上了苹果应用商店的榜首。 Nano Banana 广泛用于 meme 生成和对话式图像编辑,短暂帮助 Gemini 在应用程序下载和会话方面超越 ChatGPT