Generator wideo AI Pyramid Flow o otwartym kodzie źródłowym jest już dostępny online
Stając się już popularnym w filmach instruktażowych na YouTubepyramid Flow to nowy model sztucznej inteligencji, który został przeszkolony na zbiorach danych typu open source, które łącznie obejmują około 10 milionów filmów. Pyramid Flow, dzieło zespołu skupiającego badaczy sztucznej inteligencji z Uniwersytetu Pekińskiego, Kuaishou Technology i Pekińskiego Uniwersytetu Poczty i Telekomunikacji, jest sam w sobie open-source. Objęty warunkami licencji MIT https://en.wikipedia.org/wiki/MIT_Licensemoże generować wirtualne treści wideo w wysokiej rozdzielczości (768p) i oczywiście błyszczy, gdy ma do czynienia z 384p. Według jego twórców, jest on w stanie wygenerować pięciosekundowe wideo w czasie krótszym niż minuta (przy użyciu procesora graficznego A100 w nieujawnionej konfiguracji sprzętowej).
W niektórych scenariuszach Pyramid Flow przoduje. Jednak w przypadku niektórych podpowiedzi tekstowych wyniki są dalekie od zadowalających. Podobnie jak w przypadku wielu aplikacji generatywnej sztucznej inteligencji, praca z takim narzędziem wiąże się z pewną dozą losowości. Z drugiej strony, podejście tego modelu zużywa znacznie mniej mocy obliczeniowej niż jego konkurenci, a ponieważ jego kod jest open-source, może być używany w aplikacjach lokalnych lub chmurowych przez zainteresowanych bez konieczności zawracania sobie głowy częścią licencyjną.
Naukowcy zajmujący się sztuczną inteligencją, którzy stworzyli Pyramid Flow, wymienili jednak wszystkie zbiory danych wykorzystane do jego szkolenia, ale nie wspomnieli nic o kwestiach związanych z prawami autorskimi, które mogą się pojawić. Podczas gdy niektórzy twórcy treści twierdzą, że wirtualne filmy wykonane przy użyciu materiałów open-source naruszają prawa właścicieli praw autorskich, Pyramid Flow może być przydatny w dostrajaniu tego rodzaju treści bez konieczności angażowania stron trzecich.
Osoby zainteresowane sztuczną inteligencją z perspektywy open source mogą pobrać Open-Source AI: The Future of Data Research autorstwa J.D. TjonWolf z Amazon za 9,99 USD (Kindle) lub 12,99 USD (miękka).
Źródło(a)
Pyramid Flow (na GitHub, via Tech Xplore)