Dogłębna analiza architektury AMD RDNA 4: Monolityczna konstrukcja 64-CU z wszechstronnymi ulepszeniami w zakresie obliczeń, kodowania i dekodowania multimediów, ray tracingu i sztucznej inteligencji

AMD RDNA 4 został stworzony z myślą o wysokiej klasy grach, ray tracingu i obciążeniach ML. (Źródło obrazu: AMD)

Firma AMD opowiedziała o kilku kluczowych aspektach RDNA 4, które zostaną oficjalnie zaprezentowane dzisiaj. Układ RDNA 4, dostępny w nowych procesorach graficznych Radeon RX 9070 XT i RX 9070, zapewnia wrażenia z gier i tworzenia treści nowej generacji dzięki obsłudze nowych funkcji ray tracingu i śledzenia ścieżek, skalowaniu w oparciu o ML z FSR 4 oraz nowym możliwościom kodowania i dekodowania wideo.

Vaidyanathan Subramaniam (tłumaczenie Ninh Duy), Opublikowany 28/02/2025 🇺🇸 🇫🇷 ...

Launch AMD Radeon GPU Gaming Desktop

AMD zaoferowało sneak peek rDNA 4 na targach CES 2025 i potwierdziło pojawienie się kart Radeon RX 9070 XT i RX 9070, ale nie zaoferowało nawet przelotnej uwagi na temat nowej architektury podczas faktycznego keynote.

Firma utrzymywała jednak, że więcej informacji na temat RDNA 4 i nowych procesorów graficznych Radeon pojawi się wkrótce i oto jesteśmy.

Dziś AMD ujawnia RDNA 4 i nowe procesory graficzne z serii Radeon RX 9070. Seria RX 9070 będzie oficjalnie dostępna w sklepach detalicznych od 6 marca, a recenzje wydajności pojawią się dzień wcześniej.

AMD RDNA 4: Powrót do monolitycznej konstrukcji

RDNA 4 opiera się na celach, które AMD wyznaczyło sobie w RDNA 3. Według AMD, RDNA 4 został zaprojektowany z myślą o cięższych obciążeniach w grach, z naciskiem na lepszą wydajność i efektywność rasteryzacji.

Następnie wprowadzono zwyczajowe ulepszenia potoków ray tracingu, a także ponownie skupiono się na możliwościach sztucznej inteligencji i kodowaniu/dekodowaniu multimediów.

Wzrost wydajności jednostki obliczeniowej z RDNA 2 do RDNA 4. (Źródło obrazu: AMD)

W RDNA 3 pojawiła się konstrukcja chipletowa dla układów GPU, czerpiąca inspirację z procesorów Ryzen. Widzieliśmy tutaj oddzielenie matryc pamięci podręcznej (MCD) od matrycy obliczeniowej grafiki (GCD).

W przypadku RDNA 4, AMD powraca jednak do tradycyjnej monolitycznej konstrukcji. Komponenty są zasadniczo takie same, ale nie ma połączeń MCD-GCD, ponieważ pamięć i obliczenia są teraz bezpośrednio połączone przez Infinity Cache.

Procesor graficzny RDNA 4, w tym przypadku Radeon RX 9070 XT, zawiera cztery silniki cieniujące z ośmioma procesorami grup roboczych (WGP) każdy. Każdy WGP składa się z ośmiu jednostek obliczeniowych (CU), co daje łącznie 64 CU.

AMD twierdzi, że nowe jednostki obliczeniowe są teraz bardziej wydajne niż kiedykolwiek, umożliwiając ulepszony ray tracing, podwojenie szczytowej przepustowości, obsługę najnowszych możliwości akceleracji macierzy z szerszą obsługą formatów numerycznych.

Nowością w RDNA 4 CU, którą widzieliśmy już w rdzeniach Tensor w architekturze Ampere firmy Nvidia, jest obsługa strukturalnej rzadkości, która pozwala na szybsze operacje na macierzach, zwłaszcza w przypadkach, gdy wiele wag wynosi zero.

Widzimy również ulepszenia w podsystemie pamięci. Pamięć podręczna L2 została zwiększona z 6 MB w RDNA 3 do 8 MB w RDNA 4, podczas gdy pamięć podręczna Infinity została ulepszona do 3. generacji, ale spadła do 64 MB z 96 MB w RDNA 3.

AMD nadal polega na pamięci GDDR6 w nowej generacji. Zarówno RX 9070 XT, jak i RX 9070 oferują 384-bitowy interfejs pamięci GDDR6 o pojemności 16 GB taktowany zegarem 20 Gb/s, co daje efektywną przepustowość 640 GB/s. Jest to znacznie mniej niż przepustowość 960 GB/s oferowana przez RDNA 3, ale AMD twierdzi, że specyfikacje pamięci wideo RDNA 4 zostały starannie dobrane, aby obsługiwać obecne i przyszłe tytuły.

Architektura RDNA 4. (Źródło obrazu: AMD)

Architektura RDNA 3 dla porównania. (Źródło obrazu: AMD)

Ulepszony silnik multimediów i obsługa sprzętowego pomiaru przerzucania

Kodowanie wideo było jedną z głównych pułapek RDNA 3, a AMD obiecuje znaczną poprawę w tym zakresie. Firma obiecuje znaczne ulepszenia w kodowaniu H.264 i AV1 oraz mniej blokujących artefaktów przy tej samej ilości danych.

Ulepszenia dotyczą również dekodowania wideo, ze zmniejszonym zużyciem energii i zwiększoną wydajnością podczas dekodowania formatów takich jak AV1 i VP9.

Radiance Display Engine zużywa teraz znacznie mniej energii w dwumonitorowych konfiguracjach FreeSync. Nowością jest również obsługa sprzętowej kolejki przerzucania w Windows Display Driver Model (WDDM) 3.0 dla odtwarzania wideo.

Zwalnia to zasoby CPU poprzez odciążenie układu GPU od planowania klatek. Technologia generowania wielu klatek (MFG) w układach GPU Nvidia Blackwell również opiera się na sprzętowym pomiarze klatek.

RDNA 4: Ulepszenia silnika multimediów. (Źródło obrazu: AMD)

Radiance Display Engine obsługuje teraz sprzętowy flip metering. (Źródło obrazu: AMD)

Spojrzenie na jednostkę obliczeniową RDNA 4

Na początku struktura RDNA 4 CU nie różni się zbytnio od tego, co widzieliśmy w RDNA 3. Istnieją jednak ulepszenia wydajności i efektywności w każdym z komponentów CU.

Operacje WMMA (Wave Matrix Multiply Accumulate) zostały ulepszone, aby spełnić wymagania nowego sprzętu. Jednostki skalujące otrzymały ulepszenia do obsługi operacji Float32. Harmonogram może dzielić i przetwarzać duże obciążenie obliczeniowe na podzielone i nazwane bariery.

AMD stwierdziło, że RDNA 4 został zbudowany z myślą o nowych technikach renderowania, których deweloperzy używają w dzisiejszych grach. Podczas gdy skalowanie w górę było w modzie, efektywne śledzenie ścieżek wymaga akceleracji ML jako części samego procesu renderowania, a nie jako refleksji.

RDNA 4: Silnik obliczeniowy. (Źródło obrazu: AMD)

ML jest teraz częścią rdzenia procesu renderowania. (Źródło obrazu: AMD)

Akceleratory promieniowania w RDNA 4

RDNA 4 oferuje 64 akceleratory promieni trzeciej generacji w RX 9070 XT. Struktura akceleratora promieni w RDNA 4 jest podobna do tej w RDNA 3, ale zawiera dodatkowy silnik przecinania dla 2x większej liczby jednostek ray box i ray triangle.

Istnieje również dedykowana sprzętowa transformacja promieni, która eliminuje potrzebę korzystania z instrukcji cieniowania, minimalizując w ten sposób narzut związany z przechodzeniem promieni. Pamięć 128 KB w każdej podwójnej jednostce CU pomaga przechowywać stos promieni dla wydajnych operacji wypychania i sortowania.

RDNA 4 wprowadza koncepcję zorientowanych ramek ograniczających (OBB), które wyrównują ramki ograniczające BVH do geometrii, minimalizując w ten sposób fałszywie dodatnie interakcje promieni w tym, co w przeciwnym razie jest tylko pustą przestrzenią w pudełku. AMD twierdzi, że takie podejście może poprawić wydajność przechodzenia promieni nawet o 10%.

Nowością jest również obsługa zrelaksowanych żądań pamięci poza kolejnością, która skutecznie skraca czas oczekiwania na fale, które nie trafiły wcześniej do pamięci podręcznej wysokiego poziomu. Usprawnia to nie tylko ray tracing, ale także inne obciążenia.

W RDNA 4 shadery mogą dynamicznie alokować rejestry, co pozwala pomieścić więcej fal w locie z poprawionym opóźnieniem pamięci.

Struktura akceleratora promieniowania RDNA 4. (Źródło obrazu: AMD)

RDNA 4 wprowadza OBB (źródło obrazu: AMD)

RDNA 4 umożliwia bardziej swobodne porządkowanie strumieni żądań fal. (Źródło obrazu: AMD)

Akceleratory promieni RDNA 4 zapewniają 2-krotnie wyższą wydajność ray traversal niż RDNA 3. (Źródło obrazu: AMD)

Dynamiczna alokacja rejestru shaderów RDNA 4. (Źródło obrazu: AMD)

Śledzenie ścieżki z RDNA 4

Karty AMD ogólnie zmagały się z ray tracingiem, więc śledzenie ścieżek wydawało się wykluczone nawet w przypadku topowych kart RDNA 3. RDNA 4 ma to zmienić dzięki obsłudze neuronowego buforowania promieniowania wraz z nowym neuronowym supersamplingiem i modelem denoisingu.

Firma AMD nie podała dokładnych danych dotyczących wydajności w tytułach obsługujących śledzenie ścieżek, ale powinniśmy mieć o tym pojęcie podczas recenzowania tych kart.

RDNA 4 zapewnia ulepszoną obsługę śledzenia ścieżek w grach. (Źródło obrazu: AMD)

Krok 1: Śledzenie ścieżki rozpoczyna się od 1 próbki na piksel. (Źródło obrazu: AMD)

Krok 2: Próbkowanie siatki i neuronowe buforowanie promieniowania w celu przybliżenia oświetlenia sceny. (Źródło obrazu: AMD)

Krok 3: Przywrócenie oświetlenia bezpośredniego i globalnego. (Źródło obrazu: AMD)

Krok 4: Neuronowe supersampling i denoising. (Źródło obrazu: AMD)

Możliwości sztucznej inteligencji oparte na układach Radeon i Instinct

AMD poinformowało, że RDNA 4 oferuje dedykowane potoki matematyczne do akceleracji ML skoncentrowane na wysokiej wydajności z węższymi typami danych. Nowością w RDNA 4 jest obsługa FP8 i BF8 dla wysokiej wydajności i precyzji wnioskowania.

Demonstrując generowanie obrazu SDXL 1.5, AMD pokazało, jak Radeon RX 9070 XT oparty na RDNA 4 oferuje dwukrotnie wyższą wydajność FP16 na jednostkę CU w porównaniu do RX 7900 XT opartego na RDNA 3.

Wykorzystując nowe możliwości sztucznej inteligencji RDNA 4, FSR 4 jest kompleksowym potokiem wyszkolonym na procesorach graficznych AMD. FSR 4 wykorzystuje FP8 w celu optymalnego wykorzystania przepustowości, wydajności i mocy.

AMD wykazało nawet 3,7-krotną poprawę liczby klatek na sekundę dzięki FSR 4 w połączeniu z interpolacją klatek i Radeon Anti-Lag przy zachowaniu wysokiej jakości obrazu.

RDNA 4 oferuje dedykowane potoki matematyczne dla ML (źródło obrazu: AMD)

wydajność 2x FP16 na CU w porównaniu do RDNA 3. (Źródło obrazu: AMD)

FSR 4 wykorzystuje możliwości FP8 RDNA 4. (Źródło obrazu: AMD)

Znaczny wzrost liczby klatek na sekundę dzięki FSR 4 i interpolacji klatek w rozdzielczości 4K. (Źródło obrazu: AMD)

Źródło(a)

Komunikat prasowy AMD

Powiązane artykuły

AMD Radeon RX 9060 ma potwierdzoną datę premiery

Procesor graficzny AMD RX 9060 wkrótce zapewni wydajność RDNA 4 i FSR 4 w grach klasy podstawowej 01/03/2025

AMD FSR 4 wykorzystuje możliwości FP8 RDNA 4 do skalowania w górę i generowania klatek. (Źródło obrazu: AMD)

AMD mówi o FSR 4, Hypr-RX i nowym oprogramowaniu Adrenalin, FSR 4 wykorzystuje zastrzeżony model i jest na razie ograniczony do kart RDNA 4 28/02/2025

Procesory graficzne AMD Radeon RX 9070 XT i RX 9070 RDNA 4 ujawniają pełną wydajność. (Źródło obrazu: AMD)

AMD Radeon RX 9070 XT i RX 9070: karty obsługujące 4K w cenie 1440p ze znacznym wzrostem wydajności w porównaniu do RTX 3090 i RX 6900 XT 28/02/2025

Gotowe komputery PC z kartami graficznymi Radeon RX 9070 i 9070 XT pojawiły się w sklepie Newegg. (Źródło zdjęcia: @Olrak29_ via X)

Gotowe komputery do gier z serii AMD Radeon RX 9070 pojawiają się teraz w sklepach internetowych 28/02/2025

Wsparcie FSR 4 dla kart graficznych Radeon RX 9070 obejmuje Monster Hunter Wilds i Marvel Rivals 28/02/2025

Linia XMG NEO 16 2025 skierowana do graczy i twórców treści (Źródło obrazu: XMG)

XMG rozpoczyna przedsprzedaż laptopów NEO 16 2025 z kartą graficzną RTX 5090 i procesorami APU Intel Arrow Lake / AMD Ryzen 9000X3D 27/02/2025

Pierwszy test porównawczy Radeona 840M OpenCL pokazuje obiecujące wyniki (Źródło obrazu: AMD - edytowane)

RDNA 3.5 AMD Radeon 840M przewyższa Radeona 740M we wczesnym teście OpenCL 27/02/2025

Linglong Host mieści wiele w obudowie o wymiarach 300 x 11 x 15 mm i wadze 800 g. (Źródło obrazu: ARFirst)

Składany komputer PC z klawiaturą Linglong Host z baterią 60 Wh i procesorem AMD Ryzen 7 8840U 27/02/2025

Karta graficzna Gigabyte RX 9070 XT (źródło obrazu: Gigabyte, AMD)

Cena RX 9070 XT będzie niższa niż RTX 5070 Ti, według materiałów prasowych AMD 26/02/2025

Monster Hunter Wilds jest darmowy z kwalifikującymi się procesorami AMD Ryzen, kartami graficznymi Radeon i laptopami przez ograniczony czas. (Źródło obrazu: AMD)

Monster Hunter Wilds za darmo z wybranymi procesorami i kartami graficznymi AMD 26/02/2025

Gotowe komputery do gier z serii AM...

AMD Radeon RX 9070 XT i RX 9070: ka...

Editor of the original article: Vaidyanathan Subramaniam - Managing Editor - 1997 articles published on Notebookcheck since 2012

contact me via: @Geeky_Vaidy

Translator: Ninh Ngoc Duy - Editorial Assistant - 524651 articles published on Notebookcheck since 2008

contact me via: Facebook

Please share our article, every link counts!

> laptopy testy i recenzje notebooki > Nowinki > Archiwum v2 > Archiwum 2025 02 > Dogłębna analiza architektury AMD RDNA 4: Monolityczna konstrukcja 64-CU z wszechstronnymi ulepszeniami w zakresie obliczeń, kodowania i dekodowania multimediów, ray tracingu i sztucznej inteligencji

Vaidyanathan Subramaniam, 2025-02-28 (Update: 2025-02-28)