Grok otrzymuje nowy model generowania obrazu z możliwością renderowania tekstu i twarzy
xAI właśnie dodało https://x.ai/blog/grok-image-generation-release generowanie obrazów do Grok, co stanowi krok naprzód dla platformy. Funkcja jest obecnie dostępna dla użytkowników X w niektórych krajach, a globalne wdrożenie spodziewane jest za około tydzień.
Generator obrazów, początkowo nazywany Aurora, a obecnie będący częścią rodziny Grok, wykorzystuje fantazyjny system autoregressive mixture-of-experts wyszkolony na miliardach przykładów z całego Internetu. Zasadniczo może on przewidywać kolejne fragmenty informacji, łącząc tekst i obrazy, co pozwala mu tworzyć znacznie bardziej realistyczne obrazy niż wcześniej.
Ale nie chodzi tylko o tworzenie obrazów od podstaw. System ten może również pobierać istniejące obrazy i pozwalać użytkownikom na ich ulepszanie lub wykorzystywanie ich jako inspiracji do nowych kreacji. xAI twierdzi, że model ten wykonuje szczególnie dobrą robotę w obszarach, w których inne generatory mają trudności, takich jak prawidłowe tworzenie tekstu, logo i ludzkich twarzy.
Aktualizacja ta pojawia się zaraz po wydaniu Grok 1.5V w kwietniu, co dało platformie pierwszy smak przetwarzania wizualnego. I xAI nie poprzestaje na tym - są zajęci modernizacją swojego superkomputera Colossus w Memphis, który ma już 100 000 procesorów graficznych Nvidia H100 i H200 i planuje wkrótce podwoić tę liczbę.
Moment tej premiery jest interesujący, ponieważ OpenAI właśnie wprowadziło swój własny model generowania wideo, Sora, co jasno pokazuje, że konkurencja w generatywnej sztucznej inteligencji między dużymi graczami zaostrza się.