IBM uruchamia modele Granite 3.0 open-source AI dla firm
IBM zaprezentował dziś swoją najbardziej zaawansowaną rodzinę modeli sztucznej inteligencji, podnosząc numer wersji Granite do 3.0. We wrześniu 2023 roku IBM wprowadził modele fundamentalne Granitea teraz przechodzą na model open-source, jednocześnie ulepszając każdy inny aspekt. Wszystkie modele Granite 3.0 (zostaną wymienione później) są objęte warunkami licencji Apache 2.0, co pozwala na korzystanie z nich zarówno klientom korporacyjnym, jak i całej społeczności.
Trzy gałęzie Granite 3.0 i członkowie każdej z nich są następujący:
- General Purpose/Language: Granite 3.0 8B Instruct, Granite 3.0 2B Instruct, Granite 3.0 8B Base, Granite 3.0 2B Base
- Poręcze i bezpieczeństwo: Granite Guardian 3.0 8B, Granite Guardian 3.0 2B
- Mieszanka ekspertów: Granite 3.0 3B-A800M Instruct, Granite 3.0 1B-A400M Instruct, Granite 3.0 3B-A800M Base, Granite 3.0 1B-A400M Base
W przeciwieństwie do swoich konkurentów, którzy są szkoleni na danych publicznych, modele IBM Granite wykorzystują dane przedsiębiorstwa i mogą być łatwo zintegrowane z różnymi przepływami pracy i środowiskami biznesowymi, obniżając koszty nawet 23-krotnie w porównaniu z dużymi modelami granicznymi. Według IBM, szkolenie tych nowych modeli obejmowało ponad 12 bilionów tokenów na danych pochodzących z 12 różnych języków naturalnych i 116 różnych języków programowania.
Jednym z najważniejszych elementów rodziny jest Guardian 3.0, który oferuje wiodące na rynku wykrywanie ryzyka i szkód, biorąc pod uwagę ugruntowanie, trafność kontekstu i trafność odpowiedzi oprócz już powszechnych atrybutów, takich jak uprzedzenia społeczne, nienawiść, toksyczność, wulgaryzmy, przemoc, jailbreaking i tak dalej.
Ci, którzy chcą rozpocząć pracę z IBM Granite 3.0 (lub przejść do nowych fragmentów kodu), mogą przejść do Hugging Face i pobrać je. Podczas gdy wybrane modele trafią do mikrousług NIM firmy Nvidia i integracji Google Cloud Vertex AI Model Garden z Hugging Face, warianty instruktażowe nowych modeli językowych Granite 3.0 8B i 2B oraz modele Granite Guardian 3.0 8B i 2B są dostępne do użytku komercyjnego za pośrednictwem platformy IBM watsonx platforma.
Pod koniec sierpnia Clifford A. Pickover opublikował książkę Artificial Intelligence: An Illustrated History: From Medieval Robots to Neural Networks, książkę, która jest już dostępna w cenie 8,99 USD w formacie Kindle i 17,26 USD w wersji papierowej.
Źródło(a)
IBM przedstawia Granite 3.0: Wysokowydajne modele sztucznej inteligencji stworzone dla biznesu
- Nowe modele Granite 3.0 8B i 2B, udostępnione na liberalnej licencji Apache 2.0, wykazują wysoką wydajność w wielu akademickich i korporacyjnych testach porównawczych, będąc w stanie przewyższyć lub dorównać modelom o podobnej wielkości
- Nowe modele Granite Guardian 3.0 zapewniają najbardziej wszechstronne możliwości IBM w zakresie poręczy, aby rozwijać bezpieczną i godną zaufania sztuczną inteligencję
- Nowe modele Granite 3.0 Mixture-of-Experts umożliwiają niezwykle wydajne wnioskowanie i niskie opóźnienia, odpowiednie do wdrożeń opartych na CPU i przetwarzania brzegowego
- Nowy model Granite Time Series osiągnął najnowocześniejszą wydajność w prognozowaniu typu zero/few-shot, przewyższając modele 10 razy większe
- IBM prezentuje następną generację watsonx Code Assistant opartego na Granite do kodowania ogólnego przeznaczenia; Debiutuje nowe narzędzia w watsonx.ai do tworzenia i wdrażania aplikacji i agentów AI
- Zapowiada, że Granite stanie się domyślnym modelem Consulting Advantage, platformy dostarczania opartej na sztucznej inteligencji, wykorzystywanej przez 160 000 konsultantów IBM do szybszego dostarczania nowych rozwiązań klientom
ARMONK, N.Y., 21 października 2024 r. /PRNewswire/ -- Dziś na konferencji IBM (NYSE: IBM) firma ogłosiła wydanie swojej najbardziej zaawansowanej rodziny modeli sztucznej inteligencji, Granite 3.0. Flagowe modele językowe IBM Granite trzeciej generacji mogą przewyższać lub dorównywać modelom o podobnej wielkości od wiodących dostawców modeli w wielu akademickich i branżowych testach porównawczych, wykazując wysoką wydajność, przejrzystość i bezpieczeństwo.
Zgodnie z zaangażowaniem firmy w sztuczną inteligencję typu open source, modele Granite są wydawane na liberalnej licencji Apache 2.0, co czyni je wyjątkowymi pod względem połączenia wydajności, elastyczności i autonomii, które zapewniają klientom korporacyjnym i całej społeczności.
Rodzina IBM Granite 3.0 obejmuje:
- Język ogólnego przeznaczenia: Granite 3.0 8B Instruct, Granite 3.0 2B Instruct, Granite 3.0 8B Base, Granite 3.0 2B Base
- Poręcze i bezpieczeństwo: Granite Guardian 3.0 8B, Granite Guardian 3.0 2B
- Mieszanka ekspertów: Granite 3.0 3B-A800M Instruct, Granite 3.0 1B-A400M Instruct, Granite 3.0 3B-A800M Base, Granite 3.0 1B-A400M Base
Nowe modele językowe Granite 3.0 8B i 2B zostały zaprojektowane jako modele "konia roboczego" dla korporacyjnej sztucznej inteligencji, zapewniając wysoką wydajność w zadaniach takich jak Retrieval Augmented Geneneration (RAG), klasyfikacja, podsumowywanie, ekstrakcja encji i korzystanie z narzędzi. Te kompaktowe, wszechstronne modele zostały zaprojektowane tak, aby można je było precyzyjnie dostroić do danych przedsiębiorstwa i płynnie zintegrować z różnymi środowiskami biznesowymi lub przepływami pracy.
Podczas gdy wiele dużych modeli językowych (LLM) jest szkolonych na publicznie dostępnych danych, ogromna większość danych korporacyjnych pozostaje niewykorzystana. Łącząc mały model Granite z danymi przedsiębiorstwa, w szczególności przy użyciu rewolucyjnej techniki dopasowywania InstructLab - wprowadzonej przez IBM i RedHat w maju - IBM wierzy, że firmy mogą osiągnąć wydajność specyficzną dla zadania, która konkuruje z większymi modelami za ułamek kosztów (w oparciu o zaobserwowany zakres 3x-23x niższy koszt niż w przypadku dużych modeli granicznych w kilku wczesnych proof-of-concept1).
Wydanie Granite 3.0 potwierdza zaangażowanie IBM w budowanie przejrzystości, bezpieczeństwa i zaufania do produktów AI. Raport techniczny Raport techniczny Granite 3.0 i przewodnik odpowiedzialnego użytkowania zawierają opis zbiorów danych wykorzystywanych do trenowania tych modeli, szczegóły dotyczące zastosowanych etapów filtrowania, oczyszczania i selekcji, a także kompleksowe wyniki wydajności modeli w głównych benchmarkach akademickich i korporacyjnych.
Co ważne, IBM zapewnia odszkodowanie z tytułu własności intelektualnej dla wszystkich modeli Granite na watsonx.ai, dzięki czemu klienci korporacyjni mogą mieć większą pewność co do łączenia swoich danych z modelami.
Podnoszenie poprzeczki: Testy porównawcze Granite 3.0
Modele językowe Granite 3.0 wykazują również obiecujące wyniki w zakresie surowej wydajności.
W standardowych akademickich testach porównawczych zdefiniowanych przez Hugging Face's OpenLLM Leaderboard, ogólna wydajność modelu Granite 3.0 8B Instruct prowadzi średnio w porównaniu z najnowocześniejszą wydajnością podobnych modeli open source Meta i Mistral. W najnowocześniejszym benchmarku bezpieczeństwa AttaQ firmy IBM, model Granite 3.0 8B Instruct prowadzi we wszystkich mierzonych wymiarach bezpieczeństwa w porównaniu do modeli Meta i Mistral.2
W przypadku podstawowych zadań korporacyjnych RAG, korzystania z narzędzi i zadań w domenie cyberbezpieczeństwa, model Granite 3.0 8B Instruct wykazuje średnio wiodącą wydajność w porównaniu z podobnej wielkości modelami open source Mistral i Meta.3
Modele Granite 3.0 zostały przeszkolone na ponad 12 bilionach tokenów na danych pochodzących z 12 różnych języków naturalnych i 116 różnych języków programowania, przy użyciu nowatorskiej dwuetapowej metody szkolenia, wykorzystującej wyniki kilku tysięcy eksperymentów zaprojektowanych w celu optymalizacji jakości danych, wyboru danych i parametrów szkolenia. Oczekuje się, że do końca roku modele językowe 3.0 8B i 2B obejmą obsługę rozszerzonego okna kontekstowego 128K i możliwości multimodalnego rozumienia dokumentów.
Wykazując doskonałą równowagę między wydajnością a kosztem wnioskowania, IBM oferuje modele Granite Mixture of Experts (MoE) Architecture, Granite 3.0 1B-A400M i Granite 3.0 3B-A800M, jako mniejsze, lekkie modele, które można wdrożyć w aplikacjach o niskim opóźnieniu, a także we wdrożeniach opartych na procesorach.
IBM ogłasza również zaktualizowaną wersję wstępnie wytrenowanych modeli Granite Time Series, których pierwsze wersje zostały wydane na początku tego roku. Nowe modele są trenowane na 3-krotnie większej ilości danych i zapewniają wysoką wydajność we wszystkich trzech głównych testach porównawczych szeregów czasowych, przewyższając 10-krotnie większe modele Google, Alibaba i innych. Zaktualizowane modele zapewniają również większą elastyczność modelowania dzięki obsłudze zmiennych zewnętrznych i prognoz kroczących.4
Przedstawiamy Granite Guardian 3.0: zapoczątkowujemy kolejną erę odpowiedzialnej sztucznej inteligencji
W ramach tej wersji IBM wprowadza również nową rodzinę modeli Granite Guardian, które umożliwiają twórcom aplikacji wdrażanie barier bezpieczeństwa poprzez sprawdzanie podpowiedzi użytkownika i odpowiedzi LLM pod kątem różnych zagrożeń. Modele Granite Guardian 3.0 8B i 2B zapewniają najbardziej wszechstronny zestaw możliwości wykrywania zagrożeń i szkód dostępny obecnie na rynku.
Oprócz wymiarów szkód, takich jak uprzedzenia społeczne, nienawiść, toksyczność, wulgaryzmy, przemoc, złamanie więzienia i inne, modele te zapewniają również szereg unikalnych kontroli specyficznych dla RAG, takich jak bezpodstawność, trafność kontekstu i trafność odpowiedzi. W szeroko zakrojonych testach obejmujących 19 testów bezpieczeństwa i testów porównawczych RAG, model Granite Guardian 3.0 8B ma wyższą ogólną dokładność wykrywania szkód niż wszystkie trzy generacje modeli Llama Guard firmy Meta. Wykazał on również ogólną wydajność w wykrywaniu halucynacji średnio na równi z wyspecjalizowanymi modelami wykrywania halucynacji WeCheck i MiniCheck.5
Chociaż modele Granite Guardian wywodzą się z odpowiednich modeli językowych Granite, mogą być używane do implementacji barier ochronnych wraz z dowolnymi otwartymi lub zastrzeżonymi modelami sztucznej inteligencji.
Dostępność modeli Granite 3.0
Cały zestaw modeli Granite 3.0 i zaktualizowane modele szeregów czasowych są dostępne do pobrania na HuggingFace na liberalnej licencji Apache 2.0. Warianty instruktażowe nowych modeli językowych Granite 3.0 8B i 2B oraz modele Granite Guardian 3.0 8B i 2B są już dostępne do użytku komercyjnego na platformie IBM watsonx. Wybrane modele Granite 3.0 będą również dostępne jako mikrousługi NVIDIA NIM oraz poprzez integrację Google Cloud's Vertex AI Model Garden z HuggingFace.
Aby pomóc zapewnić deweloperom wybór i łatwość użytkowania oraz wspierać lokalne, brzegowe wdrożenia, wyselekcjonowany zestaw modeli Granite 3.0 jest również dostępny w Ollama i Replicate.
Najnowsza generacja modeli Granite rozszerza solidny katalog potężnych mechanizmów LLM IBM typu open-source. IBM współpracował z partnerami ekosystemu takimi jak AWS, Docker, Domo, Qualcomm Technologies, Inc. za pośrednictwem platformy Qualcomm® AI Hub, Salesforce, SAPi innych, aby zintegrować różne modele Granite z ofertami tych partnerów lub udostępnić modele Granite na ich platformach, oferując większy wybór przedsiębiorstwom na całym świecie.
Od asystentów do agentów: przyszłość sztucznej inteligencji dla przedsiębiorstw
IBM rozwija korporacyjną sztuczną inteligencję poprzez spektrum technologii - od modeli i asystentów, po narzędzia potrzebne do dostrajania i wdrażania sztucznej inteligencji specjalnie dla unikalnych danych i przypadków użycia w firmach. IBM toruje również drogę dla przyszłych agentów AI, którzy mogą samodzielnie kierować, odzwierciedlać i wykonywać złożone zadania w dynamicznych środowiskach biznesowych.
IBM stale rozwija swoje portfolio technologii asystentów AI - od watsonx Orchestrate, aby pomóc firmom w tworzeniu własnych asystentów za pomocą narzędzi o niskim kodzie i automatyzacji, po szeroki zestaw gotowych asystentów do określonych zadań i dziedzin, takich jak obsługa klienta, zasoby ludzkie, sprzedaż i marketing. Organizacje na całym świecie korzystają z watsonx Assistant, aby pomóc im w tworzeniu asystentów AI do zadań takich jak odpowiadanie na rutynowe pytania klientów lub pracowników, modernizacja komputerów mainframe i starszych aplikacji IT, pomaganie studentom w odkrywaniu potencjalnych ścieżek kariery lub zapewnianie cyfrowego wsparcia hipotecznego dla kupujących domy.
IBM zaprezentował dziś również nadchodzącą wersję następnej generacji watsonx Code Assistantopartego na modelach kodu Granite, oferującego pomoc w kodowaniu ogólnego przeznaczenia w językach takich jak C, C++, Go, Java i Python, z zaawansowanymi możliwościami modernizacji aplikacji dla aplikacji Enterprise Java.6 Możliwości kodu Granite są teraz również dostępne za pośrednictwem rozszerzenia Visual Studio Code, IBM Granite.Code.
IBM planuje również udostępnić nowych narzędzi, które pomogą deweloperom budować, dostosowywać i wdrażać sztuczną inteligencję bardziej efektywnie za pośrednictwem watsonx.ai - w tym struktury agentowe, integracje z istniejącymi środowiskami i automatyzacje o niskim kodzie dla typowych przypadków użycia, takich jak RAG iagenci7
IBM koncentruje się na rozwoju technologii agentów AI, które są zdolne do większej autonomii, zaawansowanego rozumowania i wieloetapowego rozwiązywania problemów. Wstępna wersja modelu Granite 3.0 8B oferuje wsparcie dla kluczowych możliwości agentowych, takich jak zaawansowane rozumowanie i wysoce ustrukturyzowany szablon czatu oraz styl podpowiedzi do wdrażania przepływów pracy z wykorzystaniem narzędzi. IBM planuje również wprowadzić nową funkcję czatu z agentem AI do IBM watsonx Orchestrate, która wykorzystuje możliwości agentowe do orkiestracji asystentów AI, umiejętności i automatyzacji, które pomagają użytkownikom zwiększyć produktywność w ich zespołach.8 IBM planuje kontynuować budowanie możliwości agentów w całym swoim portfolio w 2025 roku, w tym gotowych agentów dla określonych domen i przypadków użycia.
Rozszerzona platforma dostarczania oparta na sztucznej inteligencji w celu doładowania konsultantów IBM za pomocą sztucznej inteligencji
IBM ogłasza również ogłasza znaczną rozbudowę swojej platformy dostarczania opartej na sztucznej inteligencji, IBM Consulting Advantage. Wielomodelowa platforma zawiera agentów AI, aplikacje i metody, takie jak powtarzalne ramy, które mogą umożliwić 160 000 konsultantów IBM dostarczanie lepszej i szybszej wartości dla klienta przy niższych kosztach.
W ramach rozszerzenia, modele językowe Granite 3.0 staną się domyślnym modelem w Consulting Advantage. Wykorzystując wydajność i efektywność Granite, IBM Consulting będzie w stanie pomóc zmaksymalizować zwrot z inwestycji w projekty generatywnej sztucznej inteligencji klientów IBM.
Kolejną kluczową częścią ekspansji jest wprowadzenie IBM Consulting Advantage for Cloud Transformation and Management oraz IBM Consulting Advantage for Business Operations. Każdy z nich obejmuje agentów, aplikacje i metody AI specyficzne dla danej domeny, nasycone najlepszymi praktykami IBM, dzięki czemu konsultanci IBM mogą pomóc przyspieszyć transformację chmury i AI klientów w zadaniach, takich jak modernizacja kodu i inżynieria jakości, lub przekształcać i realizować operacje w różnych domenach, takich jak finanse, HR i zaopatrzenie.
Aby dowiedzieć się więcej o Granite i strategii IBM AI for Business, prosimy odwiedzić stronę www.ibm.com/granite.
1 Obliczenia kosztów oparte są na kosztach API za milion tokenów wycenionych przez IBM watsonx dla modeli otwartych i openAI dla modeli GPT4 (zakładając mieszankę 80% na wejściu, 20% na wyjściu) dla weryfikacji koncepcji klienta.
2 Dokument techniczny IBM Research: Modele językowe Granite 3.0
3 Dokument techniczny IBM Research: Modele językowe Granite 3.0
4 The Tiny Time Mixer: Szybkie, wstępnie wytrenowane modele dla ulepszonego prognozowania zera/niewielu strzałów na wielowymiarowych szeregach czasowych
5 Wyniki oceny opublikowane w Granite Guardian GitHub Repo
6 Planowana dostępność na 4. kwartał 2024 r.
7 Planowana dostępność na 4. kwartał 2024 r.
8 Planowana dostępność na 1. kwartał 2025 r