Nauka współpracy z AI

Ten weekend upłynął mi pod znakiem nauki współpracy z AI…

Kiedy blisko rok temu zaczynałem bliższą przygodę ze Sztuczną Inteligencją to sprawa wydawała mi się prosta – pisałem do ChatGPT językiem naturalnym, jakbym pisał do człowieka, i otrzymywałem odpowiedź, którą mogłem bez problemu zrozumieć. To prawda, nie każda z nich była w pełni satysfakcjonująca, ale umiałem sobie z tym poradzić, np. zadając pytanie w inny sposób lub doprecyzowując moje oczekiwania.

Jednak gdy przyszło do generowania grafiki to wyzwanie okazało się o wiele trudniejsze – zwłaszcza, że w tym zakresie mam ściśle określone wyobrażenia na temat obrazu, który chcę otrzymać. Wczoraj i dziś spędziłem po ok. 10 godzin każdego dnia, żeby osiągnąć wymarzony efekt, i nie wiem, czy dotarłem do połowy drogi. Okazuje się bowiem, że generowanie obrazów to kwestia dużo bardziej skomplikowana niż prowadzenie konwersacji…

Co ciekawe, spróbowałem również skorzystać z pomocy Gemini, i ono również nie dostarczyło tego, na co liczyłem. I co więcej okazało się, że każda platforma ma swoje zalety i ograniczenia, i tak naprawdę wspomniane technologie nie tyle konkurują ze sobą, co się wzajemnie uzupełniają.

Najzabawniejsze w tym wszystkim jest to, że najlepiej sprawdza się model pracy, w którym to SI na czacie sama pisze prompt na podstawie moich oczekiwań, którego następnie przeklejam w miejsce do generowania obrazów, po czym czat jeszcze raz przetwarza moje polecenie i wysyła do generatora grafiki (np. DALL-E / GPT-Image czy Nano Banana), który interpretuje je… „po swojemu”. 😉 A rezultaty są różne – raz lepsze, raz gorsze… AI potrafi zaskoczyć efektem „wow”, ale też potrafi wszystko pomieszać (łącznie z przenikaniem się przedmiotów czy dopuszczając do absurdów typu zastawienie drzwi biurkiem czy innym meblem). 😉