科技

Genie 3 是游戏中最令人兴奋的 AI 技术飞跃

发布于 2025年8月16日

更新于 2026年5月17日

作者

Amar Roy

A person faces floating rocks and a massive waterfall in a surreal game scene, created with the World model AI Genie 3

Google DeepMind 的 Genie 3 就像游戏玩家的梦想一样 – 一种可以创建整个世界的 AI，只需描述一下就可以进入这个场景，探索每一个角落，就像它是专门为你设计的关卡一样。不需要预先制作的地图，不需要加载切换场景 – 只有一个活生生的世界，它会根据你的移动做出反应。

更令人惊讶的是，这些世界有多么灵活。它们不局限于一种风格或主题，并且它们记得你在其中做了什么。添加新的事件或角色，并且可以在不中断的情况下添加新的事件或角色，你开始看到这项技术可能如何改变我们对游戏的思考方式。Google 分享的演示看起来很疯狂。对于任何曾经想看到想象力变成可玩世界的人来说，这是我们迄今为止最接近的实现。

什么是 Genie 3？

在其核心，Genie 3 是 DeepMind 所谓的“通用世界模型”。这基本上意味着一种可以模拟世界行为并生成新世界的 AI。它不输出静态图像或短视频，而是创建一个你可以交互的整个环境。

这是 DeepMind 的 Genie 项目的第三个版本，它远远领先于 Genie 1 和 2。早期版本只能处理短的、低分辨率的序列，并且帧之间有明显的间隔。Genie 3 则可以在 720p 和 24fps 下平滑运行，环境可以保持一致几分钟。这可能不像现代游戏引擎那样令人印象深刻，但对于一个即时生成一切的模型来说，这是一个巨大的飞跃。

使这个版本脱颖而出的，是它如何跟上你的步伐。每一步，每一个相机转动，每一个新角度你看到了，都会实时生成，几乎就像系统正在预测从那个角度看世界应该是什么样子。Google 的 Genie 3 也不会依赖预先构建的资产或地图。它从头开始构建自己的世界，学习已经生成的内容的上下文。这就是为什么它可以无缝地从广阔的户外景观转到详细的室内空间，而不会破坏流畅性。

Genie 3 AI 与其他世界模型的不同之处

你可能会想，“我们已经看到 AI 生成图像、视频片段，甚至其他世界模型 – 什么使 Genie 3如此特别？”像 Midjourney 这样的工具可以创建惊人的视觉效果，但它们只能生成静态快照。它们不会给你一个可以移动的空间。在另一方面，像 Tencent 的 Hunyuan World 或 Odyssey 这样的新实验已经展示了有前途的步骤，朝着交互式 AI 生成空间迈进，它们的输出看起来相当不错。然而，Genie 3 与其他模型的区别在于，它如何将一切联系在一起 – 不仅仅是生成一个场景，而是将其转化为一个对你在实时中的反应做出响应的世界。

真正的飞跃在于持久性和灵活性。Genie 3 有世界记忆，这意味着你采取的行动不会在你看向别处时消失。画一堵墙，留下一个标记，它就会保持在那里。它还支持可提示的事件，允许你在不中断的情况下添加新角色、天气变化或设置更改。其他模型可能暗示交互性，但 Genie 3 AI 感觉更接近一个适当的游戏引擎，拼接出响应你的移动的空间。

Genie 3 是否可以取代传统游戏？

这是每个游戏玩家都在思考的问题。简短的答案是：还不行。长答案是：也许有一天，在某些方面。

潜力是巨大的。想象一下，不需要扩展包或 DLC 来获得新地图 – 你只需描述一下，世界就会生成。无限重玩性。独立开发者可以瞬间原型化关卡，或者甚至让玩家通过实时输入提示来塑造自己的冒险。

但是，目前还有一些限制。Genie 3 的世界只能持续几分钟，然后一致性就会下降。虽然视觉效果令人印象深刻，但仍然不如精致的 AAA 质量。目前还没有声音，复杂的 NPC 行为也还没有实现。你可以行走和以简单的方式交互，但你不会很快就能玩到一个由 Genie 完全生成的对话树和任务的深度 RPG。

所以，传统游戏不会消失。讲故事、紧密的机制、多人游戏平衡 – 这些仍然需要人类设计。Deepmind 的 Genie 3 可能会为副内容、快速实验或全新的类型提供动力，同时手工制作的标题继续占据主导地位。然而，在未来？如果这项技术成熟，我们可能会看到混合了人工创作内容和无限 AI 生成探索的游戏。并且，这很令人兴奋。

你现在可以访问 Genie 3 AI 吗？

到现在，你可能已经很想尝试一下。问题是，你还不能下载或使用 Genie 3，因为它还没有公开提供测试。DeepMind 只将其作为研究预览，仅向选定的学者和创作者提供有限的访问权限。对于我们其他人来说，唯一的方式是通过 Google 在其博客和 YouTube 上发布的演示来查看它的实际效果。这个演示仍然值得观看，因为它展示了该系统的灵活性和响应性。

DeepMind 表示，他们将逐渐扩大访问权限，但他们正在慢慢进行。这是有道理的。像这样的强大系统需要经过测试、安全检查和反馈，然后才能更广泛地开放。如果你想保持更新，关注 DeepMind 的博客或公告是最好的方式。