谷歌推出 Gemini Omni——一款可以“模拟世界”的下一代人工智能视频生成器

原文：Google Unveils Gemini Omni—A Next-Gen AI Video Builder That Can 'Simulate the World'

将 Decrypt 添加为您的首选来源，以便在 Google 上查看我们的更多故事。

简而言之，Google 在 I/O 2026 上推出了 Gemini Omni，作为一种多模式 AI 模型，旨在从几乎任何输入生成视频和其他媒体。

DeepMind 首席执行官 Demis Hassabis 表示，Gemini Omni 将 Gemini 与 Veo、Nano Banana 和 Genie 等媒体生成模型相结合。

Gemini Omni Flash 首先通过 Flow 和 Flow Music 面向 Google AI 订阅者推出。

谷歌周二推出了 Gemini Omni，这是一种新的多模式人工智能模型，它将该公司的 Gemini AI 模型与其媒体生成工具（包括 Veo、Nano Banana 和 Genie）结合起来。

这一消息是在 Google I/O 2026 期间发布的，DeepMind 首席执行官 Demis Hassabis 将 Gemini Omni 描述为“我们的新模型，可以根据任何输入创建任何内容。”

哈萨比斯说：“它将 Gemini 的智慧与我们最好的生成媒体模型结合起来，将世界理解、多模态和编辑提升到了新的水平。”

谷歌表示，第一个版本 Gemini Omni Flash 将通过该公司的人工智能电影制作平台 Flow 和专注于人工智能辅助音乐创作的 Flow Music 推出。

我们将放弃 Gemini Omni：我们迈向可以从任何东西创建任何东西的模型的第一步 - 从视频开始。它将 Gemini 的智能与我们的生成媒体系统相结合 - 代表了世界理解、多模态和编辑方面的飞跃 🧵 pic.twitter.com/GAtqzr0VIV — Google DeepMind (@GoogleDeepMind) 2026 年 5 月 19 日

哈萨比斯称 Omni 是“迈向通用人工智能的一步”，他表示谷歌在过去的一年里将 Gemini 扩展为“一个可以理解和模拟世界的世界模型人工智能”。

谷歌推出的 Omni 建立在 Nano Banana 的流行基础上，Nano Banana 是该公司早期的人工智能图像编辑模型，去年 9 月帮助 Gemini 登上了苹果应用商店的榜首。 Nano Banana 广泛用于 meme 生成和对话式图像编辑，短暂帮助 Gemini 在应用程序下载和会话方面超越 ChatGPT

阅读原文 →