Zaktualizowana lista superkomputerów w Chinach wykazuje minimalny wzrost, podczas gdy pogłoski o ukrytych systemach eksaskalowych wciąż się utrzymują
Chińskie Towarzystwo Nauk Komputerowych opublikowało na stronie http://www.hpc100.cn/top100/23/ swoją coroczną listę 100 najlepszych superkomputerów. Niemniej jednak, tym razem jest więcej tajemnic niż kiedykolwiek wcześniej na temat rzeczywistych możliwości tego kraju w zakresie wysokowydajnych obliczeń. Ranking na rok 2024 jest w dużej mierze odzwierciedleniem zeszłorocznego, z wyjątkiem kilku drobnych skoków wydajności, które zwiększają całkowitą moc obliczeniową z 1,398 do około 1,406 ExaFLOPS.
Pierwsze miejsce zajmuje system, który został wdrożony w 2023 roku. Zawiera on 15 974 400 rdzeni CPU i uzyskał wynik 487,94 PFLOPS w teście Linpack. Chociaż przewyższa on japoński superkomputer Fugaku (442 FP64 PetaFLOPS), to nadal nie może się równać z amerykańskimi mocarzami, takimi jak El Capitan (1,742 ExaFLOPS), Frontier (1,353 ExaFLOPS) i Aurora (1,012 ExaFLOPS).
Drugi i trzeci system zadebiutowały w 2022 roku, dostarczając odpowiednio 208,26 PFLOPS i 125,04 PFLOPS. Skąpe ujawnienie przez chińskie władze głównych szczegółów tych topowych systemów doprowadziło do wielu domysłów na temat ich sprzętu, przy czym niektórzy uważają, że działają one na standardowych procesorach CPU i GPU pozyskiwanych w alternatywny sposób.
Tymczasem Jack Dongarra - współzałożyciel Top500.org - powiedział wcześniej, że Chiny mają co najmniej trzy maszyny eksaskalowe, które nie zostały oficjalnie zgłoszone. Te niewymienione systemy mają rzekomo dostarczać od 1,3 do 1,7 ExaFLOPS dzięki sprzętowi zaprojektowanemu w Chinach, a mówi się też o bestii o mocy 2 ExaFLOPS działającej na procesorach x86 Hygon.
Superkomputer Tianhe-3 - często nazywany "Xingyi" - może być najbardziej wydajnym chińskim superkomputerem superkomputerem. Podobno osiąga on 2,05 eksaflopsa w szczycie i 1,57 eksaflopsa w trybie podtrzymania na procesorze Linpack. Jest on zasilany przez układ Matrix-3000 (MT-3000), mieszaną konstrukcję, która łączy obliczenia ogólnego przeznaczenia ze specjalistyczną akceleracją.
Sam układ MT-3000 zawiera 16 rdzeni CPU, 96 rdzeni sterujących i 1536 rdzeni akceleratora, zapewniając 11,6 teraflopa mocy obliczeniowej o podwójnej precyzji przy częstotliwości 1,2 GHz, jednocześnie pracując z prędkością 45,4 gigaflopa na wat. Taki układ odchodzi od typowych oddzielnych konfiguracji CPU-GPU, takich jak hybrydowe podejście AMD MI300A CPU-GPU.
Źródło(a)
HPC100 (w języku chińskim) & NextPlatform (w języku angielskim) & TomsHardware (w języku angielskim)