Nowy model obrazu Gemini (znany również jako „nano banan”) działa całkiem dobrze i jest bardzo zabawny w użyciu z dziećmi (jedno z nich zrobiłem królową, a drugie Blippim, na ich prośbę). Ma jednak dość dziwne ograniczenia. Czasami odwzorowuje podobieństwo bardzo dokładnie. Innym razem twarze wyglądają całkowicie nie do poznania. Nie wydaje się, aby istniał jakiś wzór, który mogę dostrzec, jeśli chodzi o to, kiedy działa, a kiedy zawodzi. Google ma już całkiem dobrą technologię rozpoznawania twarzy, ponieważ robią to w Google Images. Zastanawiam się, dlaczego nie dodają automatycznego kroku kontroli jakości, który sprawdza, czy twarz w wygenerowanym obrazie dobrze pasuje do twarzy w oryginalnym obrazie i automatycznie ponawia próby tych, które nie pasują. Niekonsekwencja sprawia, że produkt wydaje się znacznie mniej magiczny. Większym problemem jest to, że poprawki obrazu, który się nie udał, dosłownie nigdy nie działają. Jest całkowicie niezdolny do powrotu, gdy zbacza na złą ścieżkę. Nawet jeśli poprawki są dość jednoznaczne i skromne. Prawie wydaje się, że to jakiś rodzaj „zatrucia kontekstu”. To wydaje się znacznie poważniejszym problemem, biorąc pod uwagę, że jest to narzędzie produktywności, które konkuruje z Photoshopem. Ale można to prawdopodobnie rozwiązać, zawsze wykonując wiele generacji w tle, oceniając je i pokazując tylko najlepszą. Nie pozwalają również na regenerację („re-roll”) obrazu, więc za każdym razem musisz zaczynać nową rozmowę. To irytujące i zanieczyszcza historię rozmowy. Ale mimo to działa całkiem dobrze i z pewnością znacznie lepiej niż podobna funkcjonalność w Facebook Messenger. Adobe absolutnie musi mieć odpowiedź na to, jeśli chce pozostać istotne.
12,85K