Chińska darmowa sztuczna inteligencja DeepSeek o otwartym kodzie źródłowym stanowi poważne zagrożenie dla ChatGPT OpenAI i innych modeli sztucznej inteligencji
Od listopada 2023 r. chińska firma DeepSeek publikuje modele sztucznej inteligencji na zasadach open source. Dzięki licencji MIT każdy może wykorzystać i dostosować model do własnych celów. Dzięki temu modele są przejrzyste i wszechstronne.
Ponadto umożliwiają one rozwój oparty na współpracy i oszczędzają pieniądze po drodze. Użytkownicy mogą przeglądać i rozumieć kod, aby zobaczyć, jak działa model. Mogą dostosować model do swoich konkretnych potrzeb i używać go do różnych zastosowań. Dlatego DeepSeek jest zaangażowany w open source, a tym samym dodaje innowacje i konkurencję do dziedziny sztucznej inteligencji.
Firma ta wyłoniła się z Fire-Flyer, który jest oddziałem chińskiego funduszu hedgingowego o nazwie High-Flyer. Początkowym celem było lepsze zrozumienie, interpretacja i przewidywanie danych finansowych na giełdzie. Od czasu wydzielenia DeepSeek w 2023 r. firma koncentruje się całkowicie na LLM, które są modelami sztucznej inteligencji zdolnymi do generowania tekstu.
Wydaje się, że firma osiągnęła znaczący przełom dzięki dwóm najnowszym członkom rodziny DeepSeek AI. Według powszechnie stosowanych testów porównawczych AI, DeepSeek-V3, DeepSeek-R1 i DeepSeek-R1-Zero często przewyższają konkurentów z Meta, OpenAI i Google w swoich dziedzinach. Jako usługa online są one również znacznie tańsze niż na przykład ChatGPT.
Ta agresywna strategia cenowa może mieć wpływ na wszystkie ceny na rynku sztucznej inteligencji i sprawić, że zaawansowane narzędzia AI będą dostępne dla szerszego grona odbiorców. Firma może sobie na to pozwolić, ponieważ chce wydawać znacznie mniej pieniędzy na szkolenie swoich modeli AI niż inne firmy. Mówiąc dokładniej, można to osiągnąć dzięki bardziej wydajnym programom szkoleniowym i dużej automatyzacji.
Z drugiej strony, DeepSeek-R1 i DeepSeek-R1-Zero są modelami rozumującymi. Oznacza to, że najpierw opracowują plan, jak najlepiej odpowiedzieć na pytanie, a następnie pracują w małych krokach. Poprawia to dokładność wyników, jednocześnie wymagając mniejszej mocy obliczeniowej. Takie podejście zwiększa jednak zapotrzebowanie na przestrzeń dyskową.
Jako sztuczna inteligencja o otwartym kodzie źródłowym, DeepSeek może działać bezpośrednio na komputerze użytkownika końcowego. Wymagane dane aplikacji są dostępne za darmo, ponieważ modele można pobrać bezpłatnie na stronie Hugging Face. Jest to jeszcze łatwiejsze dzięki programom takim jak LM Studioktóre mogą automatycznie pobrać i zainstalować cały kod aplikacji.
Oznacza to, że nie powinno być żadnych problemów z bezpieczeństwem danych i prywatnością. Podpowiedzi, dane i odpowiedzi nie opuszczają komputera. Ponadto z modelu można korzystać w trybie offline. Wysokowydajny sprzęt nie jest tutaj wymagany, ale dużo pamięci i pamięci masowej już tak. Na przykład DeepSeek-R1-Distill-Qwen-32B wymaga około 20 GB miejsca na dysku twardym.
Według DeepSeek V3, sztuczna inteligencja współpracuje z wieloma językami. Należą do nich chiński i angielski, ale także niemiecki, francuski i hiszpański. W krótkim czacie różne języki dostarczyły satysfakcjonujących odpowiedzi.
Pozostają tylko pytania i wątpliwości dotyczące chińskiej cenzury. DeepSeek-R1 zawiera cenzurę dla niektórych politycznie wrażliwych tematów. Użytkownicy, którzy próbują zapytać o pewne wydarzenia historyczne, albo nie otrzymują odpowiedzi, albo otrzymują odpowiedź "poprawioną". Na przykład, niekoniecznie trzeba pytać sztuczną inteligencję o to, co wydarzyło się na placu Tiananmen 3 i 4 czerwca 1989 roku.
DeepSeek R1 przynajmniej rozpoznaje protesty studentów i operację wojskową. Ale inne modele sztucznej inteligencji również skąpią odpowiedzi na pytania polityczne. Google Gemini wprost odmawia odpowiedzi na pytania, które mogą być związane z polityką. Dlatego też (narzuconą przez siebie) cenzurę można znaleźć w różnych SI.