Google przyznał, że zainscenizował wideo podczas demonstracji nowego modelu generatywnej sztucznej inteligencji Gemini generatywnego modelu sztucznej inteligencji. Gemini jest bezpośrednią odpowiedzią Google na Model GPT-4 OpenAIktóry szturmem podbił internet, odkąd został wprowadzony w listopadzie ubiegłego roku. Do czasu premiery GPT-4, Google było powszechnie uważane za lidera oprogramowania AI, ale nagle znalazło się w tyle w wyścigu generatywnej sztucznej inteligencji.
Rok po wprowadzeniu na rynek GPT-4, Google powraca z Gemini, który, jak twierdzi, przewyższa GPT-4, ale jest także pierwszym modelem sztucznej inteligencji, który przewyższa ludzkich ekspertów w Massive Multitask Language Understanding (MMLU). Gemini "Ultra" najwyraźniej uzyskał 90,04% w MMLU, pokonując GPT-4, który uzyskał 87,29%. Jest to jeden z trzech nowych smaków Gemini, który jest również dostępny w rozmiarach "Pro" i "Nano" - ten ostatni jest wystarczająco mały dla urządzeń Android, takich jak Pixel 8 Pro.
Jednak wszystko może nie być tym, czym się wydaje, jeśli chodzi o pierwsze rzekomo imponujące demo Google (osadzone poniżej) Gemini. Na filmie słychać, jak Gemini początkowo wchodzi w interakcję z osobą pytającą go o to, co widzi, rysując w czasie rzeczywistym, gdy zawijas przekształca się w bardziej złożony obiekt. Demo jest kontynuowane przez szereg dodatkowych scenariuszy i interakcji, z których każda jest coraz bardziej imponująca.
Kiedy Bloomberg skontaktował się z Google, aby zapytać, jak powstał ten film, Google przyznał, że wideo zostało zmontowane i że głos Gemini nie reagował na obrazy w czasie rzeczywistym, ale każdy był osobnym nieruchomym obrazem. Co więcej, podpowiedzi nie były wydawane przez osobę słyszaną na filmie za pomocą naturalnego rozpoznawania głosu (jak się wydaje), ale w rzeczywistości podpowiedzi głosowe były wprowadzane za pomocą tekstu. Według Google, wideo zostało stworzone jedynie w celu "zainspirowania programistów"
W zastrzeżeniu towarzyszącym filmowi na YouTube Google przyznaje jedynie, że "Na potrzeby demonstracji opóźnienie zostało zmniejszone, a dane wyjściowe Gemini zostały skrócone w celu zwięzłości" Różni się to znacznie od komentarza Google przekazanego Bloombergowi, w którym stwierdzono, że film został stworzony "przy użyciu nieruchomych klatek obrazu z materiału filmowego i podpowiedzi za pomocą tekstu" Z GPT-5 OpenAI w drodze, wygląda na to, że Google desperacko chce odzyskać koronę króla AI - bardzo desperacko.
Zapytaliśmy Google's Bard AI, co ma do powiedzenia na temat wpadki Google's Gemini AI - jej odpowiedź jest osadzona poniżej.