Sada možete uređivati slike ChatGPT-a, kao u Photoshop-u

AI kreatori umetnosti bazirani na difuzijskim modelima poput DALL-E i dalje imaju ograničenja koja treba prevazići. Na primer, mogu imati poteškoća u generisanju visoko detaljnih ili kompleksnih umetničkih dela, i mogu se pojaviti situacije u kojima rezultat ne odgovara savršeno namerenim instrukcijama. Dodatno, postizanje potpune umetničke ekspresije i kreativnosti samo pomoću AI alata ostaje izazov, jer ljudska intuicija i razumevanje umetničkih koncepata još uvek su neprevaziđeni.

VESTACKA INTELIGENCIJA

Miodrag Lazić

4/24/2024

Definitivno, AI generatori umetnosti poput DALL-E su napravili značajne korake u poslednje vreme, nudeći mogućnosti poput stvaranja realističnih fotografija ili umetnosti koja liči na dela stvorena od strane stvarnih ljudi. Mogućnost editovanja delova slike direktno unutar AI modela, umesto generisanja potpuno nove slike, zaista je vredan napredak. Ova funkcija ne samo da štedi vreme već i poboljšava doslednost i omogućava fino podešavanje određenih elemenata slike.

Međutim, uprkos ovim napretcima, AI kreatori umetnosti bazirani na difuzijskim modelima poput DALL-E i dalje imaju ograničenja koja treba prevazići. Na primer, mogu imati poteškoća u generisanju visoko detaljnih ili kompleksnih umetničkih dela, i mogu se pojaviti situacije u kojima rezultat ne odgovara savršeno namerenim instrukcijama. Dodatno, postizanje potpune umetničke ekspresije i kreativnosti samo pomoću AI alata ostaje izazov, jer ljudska intuicija i razumevanje umetničkih koncepata još uvek su neprevaziđeni.

Dok se AI nastavlja razvijati, fascinantno je posmatrati napredak u oblasti AI-generisane umetnosti, ali je takođe važno prepoznati i razumeti granice i izazove koji dolaze sa ovim tehnologijama.

Uređivanje slika u ChatGPT-u.

Ako ste pretplaćeni na ChatGPT Plus, možete otvoriti aplikaciju na vebu ili mobilnom uređaju i zatražiti sliku bilo čega što želite: crtani pas detektiv koji rešava slučaj u kiberpank okruženju, valoviti pejzaž brežuljaka s usamljenom figurom u srednjem planu i olujnim oblacima koji se skupljaju iznad, ili bilo šta drugo. Nakon nekoliko sekundi, dobićete svoju sliku.

Da biste uredili sliku, sada možete kliknuti na generisanu sliku, a zatim na dugme Izaberi u gornjem desnom uglu (izgleda kao olovka koja crta liniju). Zatim prilagodite veličinu alata za selekciju pomoću klizača u gornjem levom uglu i nacrtajte preko dela slike koji želite da promenite.

Ovo je značajan korak napred: Možete ostaviti deo slike netaknutim i samo osvežiti selekciju. Ranije, ako ste poslali dodatnu instrukciju tražeći da se jedan određeni deo slike promeni, cela slika bi bila regenerisana i verovatno bi značajno razlikovala od originala.

Kada završite sa selekcijom, bićete upitani da unesete nove instrukcije, samo za označeni deo slike. Kao i obično kod ovih AI alata za umetnost, što ste specifičniji, to bolje: Možete zatražiti da osoba izgleda srećnije (ili manje srećno), ili da zgrada bude obojena drugačije. Vaše zahteve će se zatim primeniti.

Na osnovu mojih eksperimenata, ChatGPT i DALL-E koriste istu vrstu AI trikova koje smo videli kod aplikacija poput Google-ovog Magic Eraser-a: Inteligentno popunjavanje pozadina na osnovu postojećih informacija u sceni, pokušavajući da sve izvan selekcije ostavi netaknuto.

Ovo nije najnapredniji alat za selekciju, i primetio sam neke nepravilnosti u granicama i ivicama objekata - što je možda očekivano, imajući u vidu koliko kontrole dobijate prilikom selektovanja. Veći deo vremena, funkcija uređivanja je dovoljno dobro radila, iako nije pouzdana svaki put, što je svakako nešto na čemu će OpenAI raditi kako bi poboljšao u budućnosti.

a desktop screen shot of a desktop screen shot of a desktop screen shot of a
a desktop screen shot of a desktop screen shot of a desktop screen shot of a
two dogs running through a field with flowers
two dogs running through a field with flowers

Gde AI umetnost doseže svoje granice

Isprobao sam novi alat za uređivanje da bih izveo razne trikove. Dobar je bio u promeni boje i položaja psa na livadi, ali nije tako dobro smanjivao veličinu gigantskog čoveka koji stoji na bedemima zamka - čovek je jednostavno nestao u zamagljenim delovima bedema, sugerišući da AI pokušava da ga naslika oko njega bez mnogo uspeha.

U kiberpank okruženju sam zatražio da se spusti automobil, ali automobil se nije pojavio. U drugoj sceni zamka, zatražio sam da se leteći zmaj okrene tako da gleda u drugom pravcu, da bude crven umesto zelenog i da mu se dodaju plamenovi iz usta. Nakon nekoliko trenutaka obrade, ChatGPT je u potpunosti uklonio zmaja.

Ova funkcija je još uvek potpuno nova, i OpenAI još uvek ne tvrdi da može da zameni uređivanje slika od strane ljudi - jer očigledno ne može. Ona će se poboljšati, ali ove greške pomažu da se pokažu izazovi s kojima se suočava određeni tip AI-generisane umetnosti.

Ono u čemu su DALL-E i slični modeli veoma dobri je znati kako rasporediti piksele da bi dali dobru aproksimaciju zamka (na primer), bazirano na milionima (?) zamkova na kojima su obučeni. Međutim, AI ne zna šta je zamak: Ne razume geometriju ili fizički prostor, zbog čega moji zamkovi imaju kulice koje izbijaju iz ničega. Ovo ćete primetiti u mnogim AI-generisanim umetničkim delima koja uključuju građevine, nameštaj ili bilo koje objekte koji nisu pravilno prikazani.

U osnovi, ovi modeli su mašine verovatnoće koje još uvek ne razumeju šta zapravo pokazuju: Zato u mnogim OpenAI Sora videima ljudi nestaju u ništavilu, jer AI veoma pametno raspoređuje piksele, a ne prati ljude. Možda ste takođe čuli o AI-u koji se bori da stvori slike parova različitih rasa, jer su parovi iste rase verovatniji, bazirano na podacima za obuku slika.

Još jedna čudnost koja je nedavno primećena jeste nemogućnost ovih AI generatora umetnosti da stvore obične bele pozadine. Ovo su neverovatno pametni alati na mnogo načina, ali oni ne "razmišljaju" na isti način kao vi ili ja i ne razumeju šta rade na isti način kao ljudski umetnik - i važno je imati to na umu dok ih koristite.

a dragonfly flying over a castle like building
a dragonfly flying over a castle like building
a white and white background with a circular shaped object
a white and white background with a circular shaped object