Google DeepMind, spółka zależna Google zajmująca się badaniami nad sztuczną inteligencją, ogłosiła na stronie Genie 2podstawowy model świata, który może tworzyć "kontrolowane przez akcję, grywalne środowiska 3D" do szybkiego prototypowania i szkolenia agentów AI.
Firma twierdzi, że Genie 2 opiera się na pracy swojego poprzednika i może tworzyć "ogromną różnorodność bogatych światów 3D" Może symulować interakcje obiektów, animacje postaci, fizykę i postacie niegrywalne (NPC) z ich animacjami i interakcjami. Model akceptuje zarówno podpowiedzi tekstowe, jak i wizualne.
Genie 2 może zapamiętywać części świata, które nie są widoczne dla gracza i renderować je, gdy staną się ponownie widoczne, podobnie jak działa Level of Detail (LOD) w grach, dostosowując złożoność obiektów i środowisk w oparciu o pole widzenia gracza (FOV).
Model może generować nową zawartość w czasie rzeczywistym i utrzymywać spójny świat "nawet przez minutę" Może również renderować środowiska z wielu perspektyw, w tym z perspektywy pierwszej osoby, trzeciej osoby lub izometrycznej.
Może również generować zaawansowane efekty, takie jak dym, interakcje obiektów, dynamika płynów, grawitacja oraz zaawansowane oświetlenie i odbicia. DeepMind twierdzi, że model ten może umożliwić szybkie prototypowanie nowych koncepcji i pomysłów. Można również tworzyć i kontrolować agentów AI za pomocą prostych podpowiedzi.
Wiele firm tworzy podstawowe modele świata, które mogą symulować i tworzyć reprezentacje środowiska. Na przykład - Decart's Oasis pozwala grać w generowaną przez sztuczną inteligencję wersję Minecrafta w czasie rzeczywistym, a start-up pioniera sztucznej inteligencji Fei Fei Li, World Labs, ma również generator 3D https://www.notebookcheck.net/World-Labs-new-AI-system-can-make-interactive-3D-worlds-from-2D-images.927741.0.html.