Google otwiera AI Test Kitchen i Imagen 3 dla większości użytkowników
Kuchnia testowa Google AI, która obejmuje zestaw narzędzi do projektowania sztucznej inteligencji dla użytkowników, została otwarta dla użytkowników w ponad 100 krajach na całym świecie. Ten ruch oznacza pierwszy raz, kiedy wiele osób na całym świecie będzie mogło korzystać z Imagen 3, najnowszego wewnętrznego oprogramowania Google do generowania obrazów AI, w jakimkolwiek oficjalnym charakterze. TextFX, MusicFX, ImageFX i VideoFX są częścią kuchni, ale użytkownicy będą musieli dołączyć do listy oczekujących na tę ostatnią.
ImageFX, zasilany przez Imagen 3, jest wyraźną gwiazdą programu i z łatwością najbardziej praktycznym z dostępnych narzędzi dla większości ludzi. Interfejs jest uproszczoną wersją generatorów tekst-obraz; osoby zaznajomione z takimi rzeczami jak NightCafe czy Dall-E poczują się swobodnie. Generator jest potężny w swoim rdzeniu, zdolny do przewyższenia wielu innych modeli pod względem fotorealizmu i trudnych tematów, takich jak tekst. ImageFX wyróżnia się jako najlepszy sposób korzystania z Imagen 3 z dwóch powodów; model zasugeruje słowa w podpowiedzi, które można zmienić w celu uzyskania innego wyniku, a użytkownicy mogą wybrać swój ulubiony obraz z próbki wyjściowej, a następnie wybrać jego część, aby dostosować go za pomocą nowej podpowiedzi.
MusicFX jest nieco mniej praktyczny, ale niemniej potężny. Użytkownicy mogą wprowadzić podpowiedź tekstową wskazującą takie rzeczy jak nastrój, styl i konwencje muzyczne lub instrumenty, które mają być użyte w danym utworze, a MusicFX wygeneruje 30-sekundowy fragment muzyki w odpowiedzi. Wyniki są zwykle chaotyczne i nie są spójne muzycznie, ale w większości przypadków łatwo stwierdzić, że model próbuje wdrożyć to, co zostało podpowiedziane.
TextFX to narzędzie, które może nadać charakter Państwa pismu. Dostępnych jest wiele różnych typów podpowiedzi, z których każdy ma swoje własne możliwości. Użytkownicy mogą wprowadzić próbkę lub temat i robić z nim takie rzeczy, jak znajdowanie powiązanych terminów, które oferują aliterację, tworzenie akronimów, rozbijanie słów na słowa główne i wiele innych. Warto zauważyć, że narzędzie zostało stworzone we współpracy z amerykańskim raperem Lupe Fiasco i zawiera samouczki wideo, w których wykorzystuje on różne oferowane podpowiedzi.
VideoFX to jedyne narzędzie w pakiecie, które nie jest jeszcze powszechnie dostępne. Jest to narzędzie do zamiany tekstu na wideo, porównywalne do Sora OpenAIktóre ma generować dynamiczne dane wyjściowe w krótkim czasie. Użytkownicy, którzy są zainteresowani jego wypróbowaniem, mogą dołączyć do listy oczekujących, która zapewni im dostęp do innych eksperymentów Google AI w miarę ich wdrażania.