Google DeepMind's Genie 2 to generator świata 3D w czasie rzeczywistym
Google DeepMind, spółka zależna Google zajmująca się badaniami nad sztuczną inteligencją, ogłosiła na stronie Genie 2podstawowy model świata, który może tworzyć "kontrolowane przez akcję, grywalne środowiska 3D" do szybkiego prototypowania i szkolenia agentów AI.
Firma twierdzi, że Genie 2 opiera się na pracy swojego poprzednika i może tworzyć "ogromną różnorodność bogatych światów 3D" Może symulować interakcje obiektów, animacje postaci, fizykę i postacie niegrywalne (NPC) z ich animacjami i interakcjami. Model akceptuje zarówno podpowiedzi tekstowe, jak i wizualne.
Genie 2 może zapamiętywać części świata, które nie są widoczne dla gracza i renderować je, gdy staną się ponownie widoczne, podobnie jak działa Level of Detail (LOD) w grach, dostosowując złożoność obiektów i środowisk w oparciu o pole widzenia gracza (FOV).
Model może generować nową zawartość w czasie rzeczywistym i utrzymywać spójny świat "nawet przez minutę" Może również renderować środowiska z wielu perspektyw, w tym z perspektywy pierwszej osoby, trzeciej osoby lub izometrycznej.
Może również generować zaawansowane efekty, takie jak dym, interakcje obiektów, dynamika płynów, grawitacja oraz zaawansowane oświetlenie i odbicia. DeepMind twierdzi, że model ten może umożliwić szybkie prototypowanie nowych koncepcji i pomysłów. Można również tworzyć i kontrolować agentów AI za pomocą prostych podpowiedzi.
Wiele firm tworzy podstawowe modele świata, które mogą symulować i tworzyć reprezentacje środowiska. Na przykład - Decart's Oasis pozwala grać w generowaną przez sztuczną inteligencję wersję Minecrafta w czasie rzeczywistym, a start-up pioniera sztucznej inteligencji Fei Fei Li, World Labs, ma również generator 3D https://www.notebookcheck.net/World-Labs-new-AI-system-can-make-interactive-3D-worlds-from-2D-images.927741.0.html.