Od czasu generacji Ampere, Nvidia zastąpiła swój flagowy model Titan kartą z serii 90 skierowaną do profesjonalistów, którzy również grają.
Karta Nvidia GeForce RTX 5090gB202 niesie ze sobą znaczące ulepszenia sprzętowe w porównaniu do RTX 4090aD102 i RTX 3090 TigPU GA102.
Podczas gdy zarówno RTX 3090 Ti, jak i RTX 4090 oferowały opcję przełączania stanu ECC pamięci VRAM w sterowniku, tej opcji co ciekawe brakuje w RTX 5090.
Czym dokładnie jest pamięć ECC?
ECC, czyli kod korekcji błędów, to technika umożliwiająca pamięci samokorygowanie. Błędy pamięci występują, gdy podczas transmisji danych dochodzi do przerzucania bitów lub gdy błędy wkradają się do danych, gdy komórki pamięci rozładowują się i uzupełniają swój ładunek.
Samokorekta jest realizowana albo przez dedykowany dziewiąty układ pamięci, który sprawdza parzystość między pozostałymi ośmioma układami w module RAM (znany jako on-die ECC), albo na poziomie kontrolera pamięci (DRAM ECC).
Konsumencka pamięć systemowa DDR5 obsługuje ECC, ale nie w całości. Domyślnie pamięć RAM DDR5 może wykrywać błędy wielobitowe, ale może korygować tylko błędy jednobitowe poprzez wbudowane sprawdzanie danych.
Ze względu na fundamentalny sposób, w jaki DDR5 dzieli 64-bitową pamięć na dwa 32-bitowe podkanały, pamięć RAM DDR5-ECC jest dostępna w 72-bitowych (32+4) modułach EC4 lub 80-bitowych (32+8) modułach EC8.
Pamięć ECC jest rzadko potrzebna w większości zastosowań konsumenckich. Jeśli nie mają Państwo pewności co do tego terminu, prawdopodobnie nie będą Państwo potrzebować pamięci ECC.
Niemniej jednak, pamięć ECC ma kluczowe znaczenie w zastosowaniach o znaczeniu krytycznym i uczeniu maszynowym, gdzie integralność danych musi być utrzymywana w całym łańcuchu.
Firma Google przekonała się o tym na własnej skórze w 1999 roku, gdy zaniedbanie pamięci ECC drastycznie wpłynęło na wydajność jej wyszukiwarki z powodu uszkodzenia pamięci.

Wszystkie układy GPU wyposażone w pamięć GDDR5 i GDDR6/6X VRAM posiadają sposób wykrywania błędów pamięci zwany Error Detection Code (EDC).
Procesory graficzne Nvidia określają tę funkcję jako Error Detection and Replay (EDR), czyli sposób żądania retransmisji bitów z kontrolera pamięci po wykonaniu cyklicznej kontroli nadmiarowej (CRC).
EDR pomaga zminimalizować artefakty pikseli, gdy pamięć VRAM jest podkręcona, choć może nieznacznie wpływać na wydajność.
Pamięć ECC VRAM w kartach RTX 4090 i RTX 5090
Choć nie jest to szeroko dyskutowane, cechą wyróżniającą karty Nvidia GeForce RTX 3090 Ti i RTX 4090 jest możliwość przełączania między stanami pamięci ECC i non-ECC za pośrednictwem sterownika.
Funkcja ta jest jednak nieobecna w nowym RTX 5090.
Wpływ włączenia ECC na wydajność
RTX 3090 Ti i RTX 4090 implementują coś, co nazywa się "miękkim ECC". Podejście to nie obejmuje oddzielnego układu scalonego do utrzymywania parzystości; zamiast tego włączenie tej funkcji przydziela część pamięci VRAM, aby działała podobnie do wbudowanego modułu ECC.
W rezultacie zmniejsza się całkowita dostępna pamięć VRAM i szybkość pamięci. W przypadku RTX 4090, użyteczna pamięć VRAM została zmniejszona z 24 GB do 22,5 GB, przy czym 1,5 GB przeznaczono na funkcje ECC.
Przełączanie stanu ECC wpływa na wydajność, jak widać poniżej. Po włączeniu ECC na RTX 4090, wyniki 3DMark Speed Way spadają o 6,4%, podczas gdy Cyberpunk 2077 2.21 Phantom Liberty doświadcza około 5% spadku średniej liczby klatek na sekundę.
Stopień wpływu na wydajność będzie się różnić w zależności od obciążenia.
Pamięć VRAM GDDR7 RTX 5090 jest oficjalnie zgodna ze specyfikacją dla wbudowanej pamięci ECC
Wraz z GDDR7, JEDEC włączył ECC on-die jako część specyfikacji VRAM, biorąc pod uwagę rosnące prawdopodobieństwo wystąpienia błędów z powodu większej gęstości pamięci. GDDR7 wykorzystuje ECC on-die z protokołem przezroczystości, który informuje kontroler pamięci o rodzaju napotkanych błędów.
Według JEDEC, GDDR7 jest w stanie w 100% skorygować błędy 1-bitowe i w 100% wykryć błędy 2-bitowe, choć wskaźnik wykrywalności spada nieznacznie do 99,3% w przypadku rzadkich błędów 3-bitowych.
Dodatkowo, oficjalna specyfikacja obejmuje również parzystość adresu polecenia z blokowaniem polecenia (CAPARBLK) w celu dalszej poprawy niezawodności magistrali adresu polecenia.
Nie jest jednak jasne, czy kontroler pamięci Blackwell domyślnie wykorzystuje tę wbudowaną funkcję ECC.
512-bitowa pamięć GDDR7 w RTX 5090 ma przepustowość 1,792 TB/s przy szybkim zegarze 28 Gb/s, co może potencjalnie powodować błędy transmisji. Poza tym, Nvidia oferuje RTX 5090 dla przepływów pracy AI, które mogą skorzystać z ECC podczas szkolenia dużych zestawów danych.
Pomimo tego, oficjalny dokument Nvidii dotyczący architektury https://images.nvidia.com/aem-dam/Solutions/geforce/blackwell/nvidia-rtx-blackwell-gpu-architecture.pdf wspomina jedynie o obsłudze "Enhanced Cyclic Redundancy Check (CRC) for Reliability, Availability, and Serviceability (RAS)", co nie jest tym samym co ECC.
Podczas gdy bezpiecznie byłoby oczekiwać, że Nvidia włączy funkcję ECC GDDR7 on-die dla procesorów graficznych stacji roboczych Blackwell, o których mówi się na stronie https://www.tomshardware.com/pc-components/gpus/nvidias-rtx-blackwell-workstation-gpu-spotted-with-96gb-gddr7-proviz-gpu-with-a-512-bit-busto dopiero okaże się, czy przełącznik stanu ECC pojawi się w konsumenckich RTX 5090 za pośrednictwem przyszłego sterownika lub aktualizacji VBIOS.
Źródło(a)
Własny