Odkryto sposób na uruchomienie modelu sztucznej inteligencji DeepSeek 671B bez drogich procesorów graficznych

Źródło zdjęcia: Aristal, Pixabay

Inżynier Hugging Face, Matthew Carrigan, ujawnił niedawno w serwisie X metodę lokalnego uruchamiania zaawansowanego modelu R1 DeepSeek z 8-bitową kwantyzacją, eliminując potrzebę stosowania drogich procesorów graficznych, przy koszcie wynoszącym 6000 USD. Klucz? Posiadanie dużej ilości pamięci w przeciwieństwie do ogromnych rezerw mocy obliczeniowej.

Daniel Miron (tłumaczenie Ninh Duy), Opublikowany 05/02/2025 🇺🇸 🇫🇷 ...

AI Software

Wprowadzony na rynek 20 stycznia 2025 r. DeepSeek-R1 to model Mixture-of-Experts (MoE) o 671B parametrów z 37B aktywnych parametrów na token. Zaprojektowany z myślą o zaawansowanym wnioskowaniu, obsługuje 128 tys. tokenów wejściowych i generuje do 32 tys. tokenów. Dzięki architekturze MoE zapewnia najwyższą wydajność przy jednoczesnym wykorzystaniu mniejszej ilości zasobów niż tradycyjne gęste modele.

Niezależne testy https://docsbot.ai/models/compare/o1-preview/deepseek-r1#benchmarks sugerują, że model językowy R1 osiąga wydajność porównywalną z O1 OpenAI, pozycjonując go jako konkurencyjną alternatywę w aplikacjach AI o wysokiej stawce. Dowiedzmy się, czego potrzebujemy, aby uruchomić go lokalnie.

Sprzęt

Ta kompilacja koncentruje się na dwóch procesorach AMD Epyc i 768 GB pamięci RAM DDR5 - nie są potrzebne żadne drogie procesory graficzne.

Obudowa: Enthoo Pro 2 Server
Płyta główna: Gigabyte MZ73-LM0 lub MZ73-LM1 (posiada dwa gniazda CPU i 24 gniazda RAM)
Procesor: 2x AMD Epyc 9004/9005 (9115 lub 9015 jako bardziej budżetowe opcje)
Chłodzenie: Arctic Freezer 4U-SP5
Pamięć RAM: 24x 32GB DDR5 RDIMM (łącznie 768 GB)
Pamięć masowa: 1TB+ NVMe SSD (aby szybko załadować 700 GB wagi modelu)
Zasilacz: Corsair HX1000i (1000W, dużo dla dwóch procesorów)

Oprogramowanie i konfiguracja

Po zmontowaniu, proszę uruchomić Linux i llama.cpp proszę zainstalować aby uruchomić model. Kluczowa modyfikacja BIOS-u, polegająca na ustawieniu grup NUMA na 0, podwaja wydajność pamięci RAM, zapewniając lepszą wydajność. Pełne 700 GB wagi DeepSeek-R1 można pobrać ze strony https://huggingface.co/unsloth/DeepSeek-R1-GGUF/tree/mainze strony Hugging Face.

Wydajność

Ta konfiguracja generuje 6-8 tokenów na sekundę - nieźle jak na w pełni lokalny model wysokiej klasy sztucznej inteligencji. Pomija ona całkowicie GPU, ale jest to zamierzone. Uruchomienie kwantyzacji Q8 (dla wysokiej jakości) na GPU wymagałoby ponad 700 GB pamięci VRAM, co kosztowałoby ponad 100 tysięcy dolarów. Pomimo swojej surowej mocy, cały system zużywa poniżej 400 W, co czyni go zaskakująco wydajnym.

Dla tych, którzy chcą mieć pełną kontrolę nad graniczną sztuczną inteligencją, bez chmury, bez ograniczeń, jest to przełom. Udowadnia on, że zaawansowana sztuczna inteligencja może być uruchamiana lokalnie, w sposób w pełni open-source, przy jednoczesnym priorytetowym traktowaniu prywatności danych, minimalizowaniu podatności na naruszenia i eliminowaniu zależności od systemów zewnętrznych.

Źródło(a)

Matthew Carrigan na X, Docsbot, DeepSeek, obrazek zwiastujący: Pixabay

Powiązane artykuły

DeepSeek-V3-0324 wydany z poprawioną wydajnością i możliwościami. (Źródło obrazu: DeepSeek)

DeepSeek wypuszcza ulepszony model sztucznej inteligencji V3 trzy miesiące po pierwszej premierze 29/03/2025

DeepSeek przyjęty przez dwóch chińskich producentów pojazdów elektrycznych (źródło zdjęcia: Dado Ruvic/Reuters)

Dwóch chińskich producentów pojazdów elektrycznych ogłasza integrację DeepSeek 08/02/2025

Apple Dostępność Intelligence może wkrótce ulec poprawie. (Źródło obrazu: Apple)

iOS 19 ma uwolnić Apple Intelligence w Chinach dzięki DeepSeek 03/02/2025

DeepSeek jest objęty zakresem irlandzkiego DPA ze względu na przetwarzanie danych osobowych (Źródło obrazu: Wygenerowano przy użyciu DALL-E 3)

DeepSeek na celowniku irlandzkiego organu ochrony danych w związku z praktykami dotyczącymi danych 01/02/2025

Sztuczna inteligencja DeepSeek jest w modzie ze względu na swoją wydajność (źródło obrazu: Google)

Klon DeepSeek AI o nazwie TinyZero został opracowany za jedyne 30 dolarów 01/02/2025

Model AI Qwen 2.5 zwycięża nad Deepseek (Źródło obrazu: AI Generated)

Model sztucznej inteligencji Alibaba Qwen 2.5 Max zwycięża nad Deepseek 30/01/2025

Karta graficzna AMD Radeon RX 7900 XTX pokonuje flagowy produkt Nvidii ostatniej generacji na własnym terenie (źródło obrazu: AMD)

Radeon RX 7900 XTX przewyższa RTX 4090 i RTX 4080 Super w teście DeepSeek AI 29/01/2025

Chińska sztuczna inteligencja DeepSeek o otwartym kodzie źródłowym jest konkurentem dla OpenAI (źródło obrazu: Imagen3)

Chińska darmowa sztuczna inteligencja DeepSeek o otwartym kodzie źródłowym stanowi poważne zagrożenie dla ChatGPT OpenAI i innych modeli sztucznej inteligencji 28/01/2025

Kamień milowy Intel XeSS: Ponad 160...

OpenAI umożliwia wyszukiwanie ChatG...

Editor of the original article: Daniel Miron - Tech Writer - 8 articles published on Notebookcheck since 2025

Translator: Ninh Ngoc Duy - Editorial Assistant - 527922 articles published on Notebookcheck since 2008

contact me via: Facebook

Please share our article, every link counts!

> laptopy testy i recenzje notebooki > Nowinki > Archiwum v2 > Archiwum 2025 02 > Odkryto sposób na uruchomienie modelu sztucznej inteligencji DeepSeek 671B bez drogich procesorów graficznych

Daniel Miron, 2025-02- 5 (Update: 2025-02- 5)