NVIDIA prezentuje model generatywnej sztucznej inteligencji LATTE3D text-to-3D nazwany "wirtualną drukarką 3D"
Podczas gdy modele sztucznej inteligencji generujące obraz i wideo dominują w wiadomościach od jakiegoś czasu, NVIDIA zrobiła krok w kolejnym logicznym kierunku dzięki LATTE3D, nowemu generatywnemu modelowi sztucznej inteligencji, który zamienia podpowiedzi tekstowe w kompletne modele 3D w mniej niż sekundę. Zostało to ogłoszone podczas NVIDIA GTC w zeszłym tygodniutechnologia ta jest reklamowana jako podobna do "wirtualnej drukarki 3D", ponieważ może natychmiastowo dostarczać modele 3D "w popularnym formacie używanym w standardowych aplikacjach renderujących", gotowe do wdrożenia w tworzeniu gier wideo, reklamie, projektach projektowych lub dowolnej aplikacji wymagającej wirtualnego środowiska, w tym VR i AR.
Generatywna sztuczna inteligencja Text-to-3D nie jest nową technologią, a sam dokument badawczy firmy NVIDIA https://research.nvidia.com/labs/toronto-ai/LATTE3D/ stawia LATTE3D przeciwko kilku istniejącym systemom, takim jak MVDream, 3DTopia i LGM. Przewagą LATTE3D jest szybkość działania. W testach porównawczych inne modele sztucznej inteligencji potrzebują od 20 sekund do nawet 30 minut na wygenerowanie wyniku, podczas gdy LATTE3D generuje porównywalny (i często wyższej jakości) rendering w zaledwie 400 milisekund.
Należy zauważyć, że podobnie jak w przypadku drukowania 3D, jakość wydruku z LATTE3D i innych modeli AI poprawia się wraz z upływem czasu. Zaletą jest to, że w przeciwieństwie do druku 3D, na początku można zdecydować się na przedkładanie szybkości nad jakość, a później zdecydować się poczekać na bardziej wyrafinowane wyniki, zamiast ustalać ustawienia od samego początku.
Podobnie jak w przypadku każdej innej generatywnej sztucznej inteligencji, LATTE3D ma potencjał do przekształcenia wielu przepływów pracy. Podczas gdy wcześniej trzeba było przeszukiwać bibliotekę zasobów 3D lub poświęcać cenne godziny pracy, aby stworzyć prosty obiekt, dzięki technologii NVIDIA wystarczy wpisać krótki opis i zaimportować wygenerowany wynik do aplikacji lub platform.
Jak dotąd zespół badawczy wyszkolił LATTE3D tylko do tworzenia modeli przedmiotów codziennego użytku i zwierząt, ale można to rozszerzyć na inne kategorie z odpowiednimi zestawami danych. Model został wytrenowany przy użyciu procesorów graficznych NVIDIA A100 Tensor Core, a w wersji demonstracyjnej firmy działał na pojedynczej karcie NVIDIA RTX A6000.
Jako projekt badawczy, LATTE3D jest nadal w fazie rozwoju i jak dotąd nie było mowy o wydaniu go jako produktu lub usługi. Przyszłe plany projektu obejmują rozszerzenie możliwości o "text-to-4D" lub generowanie animacji 3D.
Wciągające środowiska wirtualne i rzeczywistości mieszanej można odkrywać dzięki zestawowi słuchawkowemu Meta Quest 3 i okularom AR XREAL Air 2 Pro, które są dostępne na Amazon.