Narzędzie sztucznej inteligencji DiffUHaul firmy Nvidia może przesuwać obiekty na obrazach

Model sztucznej inteligencji DiffUHaul firmy Nvidia może przesuwać obiekty na obrazach (źródło obrazu: Omri Avrahami na YouTube)

Naukowcy z firmy Nvidia opracowali nowe narzędzie sztucznej inteligencji, które może przenosić obiekty na obrazach. Narzędzie może zmienić położenie obiektu na obrazie bez wpływu na tło.

Rohith Bhaskar (tłumaczenie Ninh Duy), Opublikowany 03/12/2024 🇺🇸 🇮🇹 ...

Naukowcy z firmy Nvidia opublikowali na stronie artykuł na temat nowego narzędzia sztucznej inteligencji, DiffUHaul, które może rozumieć i przenosić obiekty na obrazie bez zmiany rozmiaru lub tła. W artykule stwierdzono, że narzędzie "wykorzystuje przestrzenne zrozumienie zlokalizowanego modelu tekst-obraz do zadania przeciągania obiektów"

Obecne modele tekstowo-obrazowe zmagają się ze złożonymi zadaniami edycji obrazu, ponieważ brakuje im "rozumowania przestrzennego" DiffuHaul rozwiązuje ten problem, wprowadzając to do modelu, pozwalając mu śledzić obiekty na obrazie, "płynnie" przenosząc je bez zmiany czegokolwiek innego.

Aby to osiągnąć, narzędzie maskuje obiekt podczas etapów odszumiania, pomagając mu zrozumieć jego lokalizację i oddzielić go od tła. Następnie interpoluje różnicę między oryginalnym a wygenerowanym obrazem, aby umieścić obiekt w nowej pozycji bez dotykania tła. Następnie drobniejsze szczegóły i funkcje z oryginalnego obrazu są przenoszone do nowego w celu zachowania spójności.

▶ load Youtube video

DiffUHaul jest oparty na BlobGENmodel, który wykorzystuje zrozumienie przestrzenne do komponowania obrazów ze złożonych podpowiedzi. W artykule stwierdzono, że narzędzie nie wymaga szkolenia, co oznacza, że zostało stworzone bez żadnych zestawów danych i działa od razu po wyjęciu z pudełka.

Źródło(a)

Dokument badawczy DiffUHaul

Powiązane artykuły

Ten szkicowy Nvidia RTX 4010 wydaje się być nieco zmodyfikowaną wersją A400 Ampere Workstation GPU (Źródło obrazu: Nvidia - edytowane)

Sketchy Nvidia RTX 4010 radzi sobie zaskakująco dobrze bez oficjalnego wsparcia sterowników 18/12/2024

Nvidia współpracuje z Blizzardem, aby rozdać limitowaną edycję GeForce RTX 4080 Super, autograf GeForce 256 i liczne gadżety związane z Diablo 17/12/2024

Źródło obrazu: @compguru910, Nvidia - edytowane

Nowa aplikacja Nvidii podobno powoduje znaczny spadek wydajności w grach takich jak Black Myth: Wukong 17/12/2024

Nvidia oficjalnie rozpoczęła promocję swojej prezentacji na CES 2025 (Źródło obrazu: Nvidia)

Nvidia oficjalnie zapowiada na targach CES 2025 premierę serii RTX 50 13/12/2024

Wiedźmin 4 został zapowiedziany na The Game Awards (źródło obrazu: YouTube)

Procesor graficzny Nvidia nowej generacji pojawia się wraz z zapowiedzią Wiedźmina 4 13/12/2024

Nvidia rozdaje karty graficzne o tematyce Indiana Jones i Wielki Krąg GeForce RTX 4090 07/12/2024

Nvidia mogła przyspieszyć premierę swojej architektury Rubin, aby wykorzystać boom na sztuczną inteligencję. (Źródło obrazu: Notebookcheck - edytowane)

Nowe procesory graficzne Nvidia Rubin zostaną wprowadzone na rynek znacznie wcześniej niż oczekiwano 05/12/2024

UE wysyła kwestionariusze do klientów Nvidii, badając umowę Run:ai (Źródło obrazu: Nvidia)

UE wysyła kwestionariusze do klientów Nvidii, badając umowę Run:ai 04/12/2024

Wygląda na to, że AIB Nvidii mogą zacząć otrzymywać karty graficzne GeForce RTX 50 przed końcem roku. (Źródło obrazu: Nvidia - edytowane)

Przedstawiciel Inno3D zdaje się potwierdzać, że Nvidia GeForce RTX 5090 wypuściła swoje produkty przed terminem 30/11/2024

Oczekuje się, że węzeł 2 nm TSMC wejdzie do masowej produkcji w przyszłym roku (źródło obrazu: TSMC)

Intel, AMD, Apple, Nvidia i MediaTek mogą korzystać z najnowocześniejszego węzła 2 nm TSMC; Qualcomm jest wyraźnie nieobecny 28/11/2024

Fugatto 1 firmy Nvidia może syntetyzować dźwięk w celu tworzenia nowych dźwięków (Źródło obrazu: Fugatto Github)

Fugatto 1 firmy Nvidia może syntetyzować dźwięk, aby tworzyć nowe dźwięki 26/11/2024

GeForce RTX 4090. (Źródło obrazu: Nvidia)

GeForce RTX 5090D: Przeciek sugeruje, że Nvidia przygotowuje GPU na wyłączność w Chinach 26/11/2024

Siedziba główna Nvidia (źródło obrazu: Nvidia)

Sprzedaż platform Hopper i Blackwell firmy Nvidia zwiększyła przychody w trzecim kwartale 23/11/2024

Nvidia może zaprezentować trzy konsumenckie karty graficzne na targach CES 2025. (Źródło obrazu: Notebookcheck - edytowane)

Nowy przeciek opisuje daty premiery produktów Nvidia GeForce RTX 5070, RTX 5070 Ti, RTX 5080 i RTX 5090 23/11/2024

OnePlus zapowiada nadchodzącą globa...

Intel Arc B580 i Arc B570: Nowe kar...

Editor of the original article: Rohith Bhaskar - Tech Writer - 226 articles published on Notebookcheck since 2024

contact me via: LinkedIn

Translator: Ninh Ngoc Duy - Editorial Assistant - 521685 articles published on Notebookcheck since 2008

contact me via: Facebook

Please share our article, every link counts!

> laptopy testy i recenzje notebooki > Nowinki > Archiwum v2 > Archiwum 2024 12 > Narzędzie sztucznej inteligencji DiffUHaul firmy Nvidia może przesuwać obiekty na obrazach

Rohith Bhaskar, 2024-12- 3 (Update: 2024-12- 3)