Deepseek prezentuje Deepseek V3 AI LLM z bezpłatnym dostępem do chatbota

Deepseek otwiera bezpłatny dostęp do chatbota Deepseek V3 AI LLM dla wszystkich. (Źródło zdjęcia: Deepseek)

Wraz z premierą Deepseek V3, chińska firma zajmująca się sztuczną inteligencją ulepszyła swój czołowy Deepseek V2 LLM. LLM jest znacznie tańszy niż większość konkurencyjnych sztucznej inteligencji dzięki starannej optymalizacji procesu szkolenia.

David Chien (tłumaczenie Ninh Duy), Opublikowany 29/12/2024 🇺🇸 🇫🇷 ...

AI Software Launch Business

Deepseek zaprezentował swój najnowszy model AI large-language model (LLM) Deepseek V3, a zarówno model, jak i chatbot są dostępne za darmo.

Modele LLM, które zasilają dzisiejsze popularne chatboty, są szkolone na milionach dokumentów, aby zrozumieć powiązania między słowami i tematami. Im więcej parametrów mają te modele, tym lepiej chatboty radzą sobie z odpowiadaniem na pytania użytkowników. Miliardy używanych parametrów wymagają jednak dużej mocy obliczeniowej i energii, więc staranne dostrojenie procesu szkolenia jest kluczem do utrzymania niskich kosztów i czasu szkolenia.

Aby osiągnąć te cele, Deepseek zastosował innowacyjną strategię równoważenia obciążenia w połączeniu z obliczeniami zmiennoprzecinkowymi o niższej precyzji, 8-bitowymi (FP8), unikalną metodą firmy na zmniejszenie zużycia pamięci (Multi-Head Latent Attention lub MLA) i innymi metodami szczegółowo opisanymi w ich dokumencie technicznym.

Staranna optymalizacja procesu szkolenia Deepseek V3 utrzymała koszty poniżej 6 milionów dolarów, w przeciwieństwie do 78 milionów dolarów na szkolenie GPT-4 OpenAI lub szacowanych na ponad 500 milionów dolarów za uruchomienie, aby wytrenować GPT-5 OpenAI. Niższe koszty i szybsze szkolenie zmniejszają koszty ponoszone przez komercyjnych użytkowników Deepseek. Osoby myślące ekologicznie mogą również cieszyć się z niższego zużycia energii i zmniejszonej emisji dwutlenku węgla wymaganej do szkolenia Deepseek V3.

Deepseek V2 został już sklasyfikowany w pierwszej dziesiątce najpotężniejszych dostępnych modeli AI LLM, a wstępne testy porównawcze chatbotów firmy wykazały, że wygrał w 12 z 21 testów z najwyżej sklasyfikowanymi modelami LLM, takimi jak Anthropic Claude 3.5 Sonnet i OpenAI GPT-4o.

Czytelnicy strony mogą bezpłatnie korzystać z chatbota Deepseek V3 aby pomóc w pisaniu esejów, udzielaniu odpowiedzi i upraszczaniu pracy. Firmy mogą rozpocząć tworzenie aplikacji za pomocą interfejsu API platformy V3. Ci, którzy próbują zachować tajemnicę, powinni wiedzieć, że wszystkie dane czatu są przechowywane na serwerach zlokalizowanych w Chińskiej Republice Ludowej. Jednak największe amerykańskie firmy stojące za dzisiejszymi najlepszymi AI LLM, takie jak Facebook, również zostały przyłapane na udostępnianiu danychrównież.