Shengshu Technology ujawnia nowy generator wideo AI, aby zmierzyć się z Sora OpenAI
Shengshu Technology ujawniło swój najnowszy model AI, Vidu 1.5. Firma zamierza zaryzykować w dziedzinie generowania tekstu na wideo i obrazu na wideo, wprowadzając na rynek nowego konkurenta, który będzie konkurował z takimi firmami jak OpenAI Sora, który został zapowiedziany na początku tego roku. Dla kogoś, kto nie wie o Shengshu Technology, jest to wschodząca firma AI, która została założona w zeszłym roku w marcu 2023 roku.
Nowy model sztucznej inteligencji firmy jest bardzo podobny do Sory OpenAI, choć z pewnymi poprawkami. Vidu 1.5 ma możliwość generowania filmów o długości do ośmiu sekund z obrazów, a także podpowiedzi tekstowych. Model sztucznej inteligencji wykorzystuje własną funkcję spójności wielu podmiotów, aby płynnie łączyć ludzi, przedmioty i środowiska podczas generowania wideo na podstawie poleceń użytkownika.
Istnieje również coś, co Vidu nazywa spójnością wielu kątów, która pozwala użytkownikom generować filmy przy użyciu dowolnych wprowadzonych obrazów lub przesyłając trzy zdjęcia jednego obiektu. The AI firma twierdzi ponadto, że model AI wykorzystuje zaawansowane funkcje sterowania w celu dodania lepszego ruchu i szczegółowego tła w wygenerowanym wyniku. Według twórcy modelu, można wygenerować ośmiosekundowy film w mniej niż 30 sekund.
Vidu wymieniło również niektóre filmy AI na swojej oficjalnej stronie internetowej wygenerowane przez model Vidu 1.5, który wydaje się bardzo realistyczny. Ale haczyk polega na tym, że można tworzyć tylko ośmiosekundowe filmy, podczas gdy jego bezpośredni konkurent, model Sora, pozwala na tworzenie filmów o długości do minuty.
Mówiąc o rozdzielczości wideo, Vidu 1.5 może pochwalić się możliwością tworzenia filmów w maksymalnej rozdzielczości 1080p. Vidu 1.5 ma swoje niedoskonałości. Na przykład niektórym filmom generowanym przez sztuczną inteligencję brakuje drobnych szczegółów, a także ujawniają nierealistyczne ruchy, takie jak w scenie samochodowej, w której płomienie przechodzą przez środek samochodu. Chociaż nie są to poważne wady i nie są nawet zauważalne, dopóki nie przyjrzymy się im uważnie.
Multimodalna sztuczna inteligencja Vidu 1.5 działa w modelu freemium. Darmowa wersja pozwala na wygenerowanie 4-sekundowego klipu w rozdzielczości Speed, podczas gdy wersja premium, która kosztuje 9,99 USD miesięcznie, pozwala na wygenerowanie 8-sekundowego wideo w rozdzielczości do 1080p. Vidu 1.5 jest już dostępny dla wszystkich za pośrednictwem oficjalnej strony internetowej .