Technologie
Genie 3 est le plus excitant saut technologique de l’IA dans les jeux vidéo
Le Genie 3 de Google DeepMind est comme quelque chose sorti d’un rêve de joueur – un IA qui peut créer des mondes entiers dès que vous les décrivez. Imaginez taper une ligne sur un temple de montagne, puis y pénétrer directement, en explorant chaque recoin comme si c’était un niveau conçu spécialement pour vous. Pas de cartes préfabriquées, pas de scènes de chargement – juste un monde vivant qui réagit à mesure que vous vous déplacez à l’intérieur.
Ce qui est encore plus frappant, c’est à quel point ces mondes peuvent être flexibles. Ils ne sont pas verrouillés dans un style ou un thème particulier, et ils conservent la mémoire de ce que vous faites à l’intérieur. Ajoutez à cela la capacité d’insérer de nouveaux événements ou personnages en temps réel, et vous commencez à voir comment cette technologie pourrait changer la façon dont nous pensons aux jeux vidéo dans leur ensemble. Les démos partagées par Google ont l’air incroyables. Pour quiconque a déjà voulu voir son imagination se transformer en un monde jouable, c’est le plus proche que nous ayons été.
Qu’est-ce que le Genie 3 ?
Dans son essence, le Genie 3 est ce que DeepMind appelle un « modèle de monde à usage général ». Cela signifie essentiellement un IA qui peut simuler le comportement du monde, puis générer de nouveaux mondes sur demande. Au lieu de produire une image fixe ou une courte vidéo, il crée un environnement entier avec lequel vous pouvez interagir.
Il s’agit de la troisième version du projet Genie de DeepMind, et il est bien en avance sur le Genie 1 et 2. Les versions précédentes ne pouvaient gérer que des séquences courtes et à basse résolution avec des ruptures visibles entre les cadres. Le Genie 3, en revanche, fonctionne en douceur à 720p et 24fps, avec des environnements qui restent cohérents pendant plusieurs minutes. Cela peut ne pas sembler beaucoup par rapport aux moteurs de jeux modernes, mais pour un modèle qui produit tout en temps réel, c’est un grand bond en avant.
Ce qui fait que cette version se démarque, c’est la façon dont elle suit votre rythme. Chaque pas, chaque mouvement de caméra, chaque nouveau coin que vous regardez est généré en direct, presque comme si le système prédisait à quoi devrait ressembler le monde de cet angle. Le Genie 3 de Google ne repose pas non plus sur des actifs ou des cartes préconçus sous le capot. Il construit ses mondes image par image, en apprenant du contexte de ce qui a déjà été généré. C’est pourquoi il peut passer sans heurt d’un vaste paysage extérieur à un espace intérieur détaillé sans rompre le flux.