OpenAI ujawnia Sora, model sztucznej inteligencji, który może generować fotorealistyczne filmy z podpowiedzi tekstowych
OpenAI jest pionierem w dziedzinie konsumenckiej sztucznej inteligencji, rewolucjonizując generowanie tekstu i obrazu, dzięki DALL-E i ChatGPT. Teraz, dzięki swojej najnowszej ofercie, Sorafirma zamierza wkroczyć w domenę generowania tekstu na wideo, próbując jeszcze bardziej przesunąć granice kreatywności AI.
Sora szczyci się możliwością tworzenia filmów o długości do minuty, wraz ze skomplikowanymi scenami z "wieloma postaciami", zniuansowanym ruchem i "szczegółowym tłem" - wszystko to napędzane przez podpowiedzi użytkownika. Rezultaty są zadziwiająco realistyczne, pokazując niezaprzeczalny potencjał sztucznej inteligencji w wizualnym opowiadaniu historii.
W kilku demonstracjach dostarczonych przez OpenAI, Sora bez wysiłku ożywia podpowiedzi. Od zabytkowego SUV-a poruszającego się po górzystym terenie po kapryśną scenę puszystego potwora siedzącego obok topiącej się świecy, wygenerowane filmy wykazują niezwykłą wierność dostarczonym instrukcjom.
Sora z pewnością nie jest jednak pozbawiona niedoskonałości. Niektóre przypadki ujawniają drobne niespójności lub nierealistyczne ruchy, podkreślając obszary wymagające dopracowania, takie jak scena, w której kot prosi o śniadanie od swojego śpiącego właściciela. Podczas gdy cała scena jest przekonująco odwzorowana, uważni obserwatorzy mogą zauważyć subtelne ruchy, które odbiegają od rzeczywistości, gdy właściciel budzi się ze snu. Jednak te wady bledną w porównaniu z ogólną zdolnością modelu do tworzenia oszałamiających narracji wizualnych.
Jednym z wyróżniających się przykładów jest przedstawienie puszystego potwora obok topiącej się świecy. Rezultat wydaje się być naprawdę wspaniały, jak coś z filmu Pixar. Skomplikowane szczegóły, takie jak tekstura futra stworzenia, które w przeciwnym razie byłyby notorycznie trudne do renderowania, pokazują umiejętności Sory w obsłudze złożonych elementów wizualnych.
Obecnie Sora jest dostępna dla wybranej grupy "czerwonych zespołów", których zadaniem jest ocena potencjalnych zagrożeń i skutków. Ponadto OpenAI współpracuje z artystami wizualnymi, projektantami i filmowcami w celu zebrania opinii mających na celu zwiększenie ogólnej użyteczności modelu dla twórców treści. Ponieważ Sora jest w dalszym ciągu udoskonalana i oceniana, ma obietnicę demokratyzacji tworzenia wideo - oferując potężne narzędzie dla twórców historii i twórców, które pomoże ożywić ich wizje.