Apple MGIE wydane jako narzędzie do edycji obrazów AI typu open source
AI może być używana do edycji obrazu, jak również do generowaniajednak to zastosowanie uczenie maszynowe może mieć trudności z dopasowaniem ludzkich instrukcji, które mogą podlegać technicznym, celowym lub wyidealizowanym zmianom kosmetycznym, do rzeczywistego celu i odpowiadającego mu wyniku. Jednakże, Apple's nowy model MGIE jest już uważany za zdolny do "zrewolucjonizowania" tej technologii.
Przypisuje się mu ulepszoną "interpretację" instrukcji, wraz z kontekstem, takim jak "uświadomienie sobie", że polecenie takie jak "zmień tło i dodaj tło Star Wars " może pociągać za sobą dodanie "miecza świetlnego lub statku kosmicznego" dzięki integracji MLLM MLLMdając tym samym potencjalnie lepsze wyniki w analizie jakościowej i ocenie przez człowieka w porównaniu z konkurencyjnym InsPix2Pix lub jego poprzednikiem LLM-Guided Image Editing (LGIE).
MGIE może również wykorzystać MLLM do "rozumowania", że wezwanie do uczynienia zdjęcia żywności "zdrowszym" może obejmować zwiększenie ilości warzyw. MGIE jest w stanie zrobić to na poziomie"Photoshop", a także przeprowadzić punktową lub ogólną "optymalizację zdjęć" z dokładnością i precyzją na poziomie pikseli.
Ta najnowsza próba Apple w badaniach nad sztuczną inteligencją została zaprezentowana na Międzynarodowej Konferencji na temat Uczenia się Reprezentacji 2024 (ICLR 2024) we współpracy z zespołem z Uniwersytetu Kalifornijskiego Santa Barbara (UCSB), który opublikował również artykuł oparty na tej samej pracy, obecnie dostępny na arXiv.
Proszę kupić Apple MacBook Air M2 jako odnowiony model Premium w Starlight na Amazon
Źródło(a)
arXiv przez VentureBeat