Deepseek prezentuje Deepseek V3 AI LLM z bezpłatnym dostępem do chatbota
Deepseek zaprezentował swój najnowszy model AI large-language model (LLM) Deepseek V3, a zarówno model, jak i chatbot są dostępne za darmo.
Modele LLM, które zasilają dzisiejsze popularne chatboty, są szkolone na milionach dokumentów, aby zrozumieć powiązania między słowami i tematami. Im więcej parametrów mają te modele, tym lepiej chatboty radzą sobie z odpowiadaniem na pytania użytkowników. Miliardy używanych parametrów wymagają jednak dużej mocy obliczeniowej i energii, więc staranne dostrojenie procesu szkolenia jest kluczem do utrzymania niskich kosztów i czasu szkolenia.
Aby osiągnąć te cele, Deepseek zastosował innowacyjną strategię równoważenia obciążenia w połączeniu z obliczeniami zmiennoprzecinkowymi o niższej precyzji, 8-bitowymi (FP8), unikalną metodą firmy na zmniejszenie zużycia pamięci (Multi-Head Latent Attention lub MLA) i innymi metodami szczegółowo opisanymi w ich dokumencie technicznym.
Staranna optymalizacja procesu szkolenia Deepseek V3 utrzymała koszty poniżej 6 milionów dolarów, w przeciwieństwie do 78 milionów dolarów na szkolenie GPT-4 OpenAI lub szacowanych na ponad 500 milionów dolarów za uruchomienie, aby wytrenować GPT-5 OpenAI. Niższe koszty i szybsze szkolenie zmniejszają koszty ponoszone przez komercyjnych użytkowników Deepseek. Osoby myślące ekologicznie mogą również cieszyć się z niższego zużycia energii i zmniejszonej emisji dwutlenku węgla wymaganej do szkolenia Deepseek V3.
Deepseek V2 został już sklasyfikowany w pierwszej dziesiątce najpotężniejszych dostępnych modeli AI LLM, a wstępne testy porównawcze chatbotów firmy wykazały, że wygrał w 12 z 21 testów z najwyżej sklasyfikowanymi modelami LLM, takimi jak Anthropic Claude 3.5 Sonnet i OpenAI GPT-4o.
Czytelnicy strony mogą bezpłatnie korzystać z chatbota Deepseek V3 aby pomóc w pisaniu esejów, udzielaniu odpowiedzi i upraszczaniu pracy. Firmy mogą rozpocząć tworzenie aplikacji za pomocą interfejsu API platformy V3. Ci, którzy próbują zachować tajemnicę, powinni wiedzieć, że wszystkie dane czatu są przechowywane na serwerach zlokalizowanych w Chińskiej Republice Ludowej. Jednak największe amerykańskie firmy stojące za dzisiejszymi najlepszymi AI LLM, takie jak Facebook, również zostały przyłapane na udostępnianiu danychrównież.