科技
Genie 3 是游戏领域最令人兴奋的 AI 技术飞跃
Google DeepMind 的 Genie 3 就像游戏玩家的梦想成真一样 – 一种可以在您描述时创建整个世界的 AI 。想象一下,您输入一行关于山寺的文字,然后直接进入该场景,探索每个角落,就像它是专门为您设计的关卡一样。没有预制的地图,没有加载的切换画面 – 只有一个活生生的世界,它会根据您的移动做出反应。
更令人惊讶的是,这些世界有多么灵活。它们不局限于一种风格或主题,并且它们记得您在其中做了什么。添加新的事件或角色,并且可以在飞行中添加新的事件或角色,您开始看到这项技术可能如何改变我们对游戏的思考方式。Google 共享的演示看起来很疯狂。对于任何曾经想看到想象力变成可玩世界的人来说,这是我们迄今为止最接近的。
什么是 Genie 3?
在其核心,Genie 3 是 DeepMind 所谓的“通用世界模型”。这基本上意味着一种可以模拟世界行为并生成新世界的 AI 。它不输出静态图像或短视频,而是创建一个您可以交互的整个环境。
这是 DeepMind 的 Genie 项目的第三个版本,它远远领先于 Genie 1 和 2。早期版本只能处理短时间的低分辨率序列,并且有明显的帧间断。Genie 3另一方面,以 720p 和 24fps 平滑运行,环境可以保持一致几分钟。这可能不像 现代游戏引擎 那样令人印象深刻,但对于一个实时生成所有内容的模型来说,这是一个巨大的飞跃。
使此版本脱颖而出的原因是它如何跟上您的节奏。每一步,每一个摄像头转动,每一个新角度您查看,都会实时生成,就像系统正在预测从该角度看世界应该是什么样子。Google 的 Genie 3也不依赖预先构建的资产或地图。它从头开始构建其世界,学习上下文,并从已经生成的内容中学习。这就是为什么它可以从广阔的户外景观到详细的室内空间无缝过渡而不会破坏流程的原因。
Genie 3 AI 与其他世界模型的区别
您可能会想,“我们已经看到 AI 制作图像、视频片段,甚至其他世界模型 – 什么使 Genie 3如此特殊?”像 Midjourney 这样的工具可以创建惊人的视觉效果,但它们只能创建静态快照。它们不会给您一个空间来移动。另一方面,像 Tencent 的 Hunyuan World 或 Odyssey 这样的新实验已经展示了有前途的互动 AI 生成空间的步骤,它们的输出看起来相当不错。然而,Genie 3 与其他模型的区别在于它如何将所有内容联系在一起 – 不仅仅是生成一个场景,还将其转化为一个实时对您做出反应的世界。
真正的飞跃在于持续性和灵活性。Genie 3 具有世界记忆,因此您采取的操作不会在您看走神时消失。您可以在墙上画画,留下痕迹,它会保持在那里。它还支持可提示的事件,允许您在不破坏流程的情况下添加新的角色、天气变化或环境变化。其他模型可以暗示交互性,但 Genie 3 AI 感觉更像一个适当的游戏引擎,将响应式空间拼接在一起以跟上您的移动。
Genie 3 是否可以取代传统游戏?
这是每个游戏玩家都在思考的问题。简短的答案是:还不行。长答案是:也许有一天,在某些方面。
潜力是巨大的。想象一下,不需要扩展包或 DLC 来获得新地图 – 您只需描述您想要的东西,世界就会生成。无限重玩性。独立开发者可以瞬间原型化关卡,甚至可以让玩家通过输入提示来塑造自己的冒险。
但是目前仍有一些限制。Genie 3 的世界只能持续几分钟,然后一致性就会下降。视觉效果虽然令人印象深刻,但仍然不如 AAA 级别的游戏那么精致。目前还没有声音,复杂的 NPC 行为 也还没有实现。您可以行走和以简单的方式交互,但您不会很快地用 Genie 完全生成对话树和任务的深度 RPG 进行游戏。
所以,不,传统游戏不会消失。讲故事,紧密的机制,多人游戏平衡 – 这些仍然需要人类设计。Deepmind 的 Genie 3 可能会为副内容、快速实验或全新的类型提供动力,同时手工制作的标题继续占据主导地位。然而,在未来的某一天,如果技术成熟,我们可能会看到混合了授权内容和无限 AI 生成探索 的游戏。这种前景令人兴奋。
您可以立即访问 Genie 3 AI 吗?
到现在,您可能已经渴望尝试它了。然而,您目前无法下载或使用 Genie 3,因为它尚未公开提供测试。DeepMind 只将其作为研究预览,向选定的学者和创作者提供有限的访问权限。对于其他人来说,唯一的方式是观看 Google 在其博客和 YouTube 上发布的演示。该演示仍然值得观看,因为它展示了该系统的灵活性和响应能力。
DeepMind 表示,他们将逐渐扩大访问权限,但他们正在慢慢进行。这是有道理的。像这样的强大系统需要测试、安全检查和反馈,然后才能向更广泛的范围开放。如果您想保持更新,请关注 DeepMind 的博客或公告。