Przełom Midjourney: Jak technologia AI odmienia tworzenie postaci

Midjourney wprowadziło innowacyjną funkcję do swojego serwisu generującego obrazy AI, która pozwala na tworzenie spójnych postaci w wielu generowanych obrazach. Ta długo oczekiwana aktualizacja stanowi odpowiedź na jedno z najczęściej zgłaszanych przez użytkowników życzeń i rozwiązuje istotne wyzwanie, z jakim do tej pory mierzyły się generatory obrazów AI​.

Tradycyjnie, generatory obrazów AI opierające się na modelach dyfuzji, takich jak popularny algorytm Stable Diffusion od Stability AI, generowały nową zawartość przy każdym wprowadzeniu promptu, co sprawiało, że zachowanie spójności charakterów między obrazami było trudne. To stanowiło problem zwłaszcza w przypadku tworzenia narracji wizualnych, takich jak filmy, powieści czy komiksy, gdzie ciągłość postaci jest kluczowa​.
Nowa funkcja Midjourney, oznaczona tagiem „–cref” (od ang. character reference), pozwala użytkownikom na dodanie do swoich promptów adresu URL wcześniej wygenerowanego obrazu postaci, aby algorytm starał się dopasować cechy charakterystyczne, typ ciała i ubranie tej postaci w nowych obrazach. Dzięki tej funkcji Midjourney może ewoluować z narzędzia do generowania pomysłów w kierunku profesjonalnego narzędzia używanego przez twórców​.
Użytkownicy mają pewien wpływ na to, jak bardzo nowy obraz będzie przypominał oryginalną postać, używając tagu „–cw” (character weight) z liczbą od 1 do 100, co pozwala regulować stopień podobieństwa nowo generowanego obrazu do oryginalnego odniesienia. Funkcja ta jest obecnie testowana przez artystów i twórców, oferując im nowe możliwości w zakresie utrzymania ciągłości narracyjnej i eksploracji różnych scen, ustawień, wyrazów twarzy i rekwizytów dla ich postaci​.
Midjourney wprowadza także zaawansowane opcje, takie jak możliwość mieszania informacji z wielu obrazów za pomocą kilku tagów „–cref” z odpowiadającymi im adresami URL. Chociaż funkcja ta najlepiej sprawdza się z postaciami wygenerowanymi w ramach Midjourney, nie jest przeznaczona dla rzeczywistych osób czy zdjęć. Mimo że nie może ona uchwycić każdego szczegółu z oryginalnego obrazu, skupia się na cechach charakterystycznych postaci i pozwala na łączenie wielu odniesień do postaci w jednym obrazie​.
Nowa funkcja Midjourney to znaczący krok naprzód w generatywnej grafice AI, dający artystom i twórcom bezprecedensową kontrolę nad ich cyfrowymi narracjami. Dzięki ciągłemu udoskonalaniu i rozszerzaniu swoich możliwości, Midjourney ma potencjał, by stać się kluczowym narzędziem dla profesjonalistów w różnych dziedzinach kreatywnych.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *