»

Midjourney prenovljen v šesto

Slo-Tech - Danes je izšla nova verzija priljubljenega modela za ustvarjanje slik iz besedilnega opisa Midjourney. Istoimensko podjetje izdalo že šesto inkarnacijo priljubljenega orodja, ki jo lahko vključimo v nastavitvah (/settings) ali s stikalom "--v 6" za opisom prizora. Model je za zdaj še v fazi beta, natrenirali pa so ga povsem od začetka in ne predstavlja neposredne nadgradnje petice.

Nova verzija je še izboljšala kakovost slik, ki jih ustvarja. Te so bolj realistične in natančnejše. Končno se je model naučil tudi pisati, saj lahko v slike vstavlja besedilo, ki ima smisel in niso le črkam podobne krace. To je bil eden večjih izzivov in ena večjih pomanjkljivost, saj je DALL-E 3 ta problem že uspel rešiti. Formalno torej šestica prinaša vernejše sledenje opisu, boljšo koherenco, miksanje, boljše povečevanje ločljivosti obstoječih stvaritev (upscaling) in ustvarjanje besedila.

Druga pomembna novost pa je spremenjeni način formuliranja ukazov. Šestica je bistveno bolj občutljiva in...

0 komentarjev

Meta predstavila svoj generator slik z umetno inteligenco

Slo-Tech - Po Midjourneyju, DALL-E 3 in Stable Diffusionu je tu še četrti konkurent iz prve lige. Meta je predstavila svoj generativni model umetne inteligence za slike, ki nosi ime Emu, sicer pa ga najdemo na Imagine Meta. Model so letos že uporabljali v storitvah Facebook in Instagram, sedaj pa je zaživel samostojno, saj je na voljo kot ločena spletna stran. Za dostop pa je še vedno potrebna prijava, za kar potrebujemo profil na Facebooku ali Instagramu ali pa elektronsko pošto. Formalno v vsakem primeru ustvarimo novi Meta račun, a storitev deluje - če le nismo v Sloveniji.

Prvi vtisi so povprečni, pri čemer je letvica visoka. Storitev vsi primerjajo z Midjourneyjem, pa tudi z DALL-E 3, ki ju še ne doseže. Največ težav ima z risanjem človeških figur, kjer se posamezni udi ali deli telesa pogosto izgubijo ali prelijejo. Z obrazi je še težje, a ni pravila. Včasih Meta ustvari odličen izdelek, spet drugič je ta katastrofalno slab. Rezultati so vedno slike v kvadratnem formatu (1:1), ki imajo...

1 komentar

Nove funkcije v Midjourney 5.2

Primerjava z leve: v3, v4, v5, v5.2

Slo-Tech - Program z generativno umetno inteligenco za ustvarjanje slik iz besedilnega opisa Midjourney je minuli teden dobil novo verzijo Midjourney 5.2. Ta prinaša nekaj uporabnih novosti, med katerimi bodo naročniki bržkone najbolj veseli možnosti zoom out, ki deluje podobno kot outpainting v konkurenčnem DALL-E. To uporabniku omogoča, da vzame obstoječo sliko in jo ohrani kot osrednji del nove slike, medtem ko Midjourney doriše okolico.

Druge novosti so takisto koristne. Prenovljeni "estetski sistem" obljublja boljšo kakovost posnetkov. Ukaz "--stylize" določa, kako realistična bo podoba. Odslej bo nova funkcija high variation mode privzeto vključena, s čimer bodo razlike med generacijami podob večje.

Novi model eksplicitno vključimo v nastavitvah (/settings) ali s stikalom "--v 5.2". Ključne kvalitativne razlike so več podrobnosti, boljše barve, ostrejše slike in kompleksne kompozicije. Prav tako naj bi bolje razumel opise in parameter "--stylize". Kdor želi uporabljati stari model,...

11 komentarjev

Midjourney zaradi zlorab onesposobil brezplačno preizkusno verzijo

Umetna slika

Slo-Tech - Splet so minuli teden preplavile fotografije aretacije nekdanjega ameriškega predsednika, ki se seveda ni nikoli zgodila. Nastale so z orodjem Midjourney, ki omogoča ustvarjanje realističnih generativnih fotografij, podobno kot ChatGPT piše besedila in kot DALL-E riše. Čeprav je Midjourney plačljiva storitev, je bila na voljo tudi brezplačna preizkusna možnost, ki je povsem zadostovala za nekaj posnetkov. Ti so bili tako dobri, da so ljudje za kratek čas celo verjeli, da je papež nosil stilsko belo puhovko.

Sedaj je brezplačnih posnetkov konec
. Midjourney, ki stane od 10 dolarjev mesečno dalje, je ukinil prvih 25 brezplačni posnetkov. Ustanovitelj podjetja David Holz je pojasnil, da so zaznali izjemno povpraševanje in pogoste zlorabe. Zanimivo je, da je bil še pred pol leta Midjourney preslab, da bi lahko koga ukanil, dandanes pa so njegovi posnetki viralni. Težavna pa je predvsem njihova kakovost, zaradi katerih je na prvi pogled nemogoče ugotoviti, da so lažni. Seveda podroben...

29 komentarjev

Midjourney 5 je tu!

Primerjava Midjourney 3, 4 in 5 (od leve proti desni)

Slo-Tech - Izšla je nova verzija algoritma za ustvarjanje fotografij in slik Midjourney, ki je prvikrat ugledal luč sveta pred letom dni. Ta teden so predstavili že peto inačico, ki je dosegla povsem realistično raven. Posvetili so se izrisu kože in obraza, očem, osvetlitvi, odbojem in senčenju. Končni rezultat so ljudje, ki imajo končno pet prstov, ki imajo realistične obrazne poteze in jasne oči. Roke in oči poudarjamo zato, ker so imele vse prejšnje verzije Midjourneyja in tudi konkurence (Stable Diffusion, DALL-E) velike težave na tem področju. Dlani s šestimi ali sedmimi prsti so postale redna šala o nesposobnosti umetne inteligence.

Midjourney 5 teh težav nima več. Za zdaj je na voljo le proti plačilu, medtem ko se bodo morali brezplačni uporabniki zadovoljiti s prejšnjo verzijo. Dostop lahko dobimo na spletni strani in na njihovem Discordu. Avtorji pravijo, da je Midjourney 5 ne le boljši, temveč tudi bolj razgledan. Obvlada več slogov, na vnose (prompt) se odziva bolje, ustvari manj...

2 komentarja

Kolektivna tožba zoper avtorje umetne inteligence Stable Diffusion

Slo-Tech - Eno izmed ključnih vprašanj, ki jih je zastavila nova tehnologija, bo dobilo odgovor na sodišču. Orodja umetne inteligence za ustvarjanje fotografij (in tudi drugih vsebin) so se učila z analizo milijard obstoječih izdelkov, ki so tudi avtorsko zaščitena. Ali so potemtakem tudi njihovih izdelki v resnici plagiati oziroma povedano drugače, ali se umetna inteligenca lahko uči iz avtorsko zaščitenih del brez soglasja avtorjev? Trije umetniki menijo, da ne, zato so v ZDA vložili kolektivno tožbo zoper Stability AI in Midjourney, ki sta ustvarila orodje Stable Diffusion, in DeviantArt, ki je ustvaril svoj generator DreamUp.

Sarah Andersen, Kelly McKernan in Karla Ortiz trdijo, da so tožniki množično kršili avtorske pravice milijonov umetnikov, ko so svoje izdelke trenirali na petih milijardah slik in posnetkov (baza LAION), ki so jih našli na spletu. To sploh ni prva tovrstna tožba, saj sta Matthew Butterick in odvetniška pisarna Joseph Saveri Law Firm, ki zastopata tožnike, že bila...

45 komentarjev

DALL-E je sedaj prosto na voljo

openai.com - Pri OpenAI so odstranili čakalno vrsto za svoj slikovni algoritem DALL-E, s čimer predvsem odgovarjajo vse srditejši konkurenci, kot je Stable Diffusion.

Algoritemsko generiranje sličic iz teksta je eno najbolj zanimivih področij informacijske tehnologije v letošnjem letu; tako zaradi dih jemajočih podob, ki jih sedaj že na dnevni bazi sproducira množica uporabnikov širom sveta, kakor tudi zares nore hitrosti razvoja. Po tem, ko je družba OpenAI letošnjega aprila pokazala drugo generacijo algoritma DALL-E, namreč ne mine mesec, da ne bi na plano pokukal nov izzivalec, kakšna nova funkcija ali pa bizaren dogodek, kot je zmaga algoritemsko ustvarjene slike na umetniškem natečaju. Medtem ko je bilo še spomladi videti, da se bodo med seboj udarili tehnološki velikani ali vsaj z njihovim denarjem podprte entitete, pa se v zadnjem času v ospredje prebijajo tudi samostojne in odprte rešitve, kot sta Midjourney ter Stable Diffusion. Posebno slednji je zaradi odprtokodne narave v začetku...

28 komentarjev

Avtor strip umetne inteligence registriral kot avtorsko delo

Slo-Tech - Še v začetku tega leta je ameriški Urad za avtorske pravice (US Copyright Office) zavračal registracijo del, ki jih je ustvarila umetna inteligenca, ker ji manjka ključna sestavina za zaščito: človeško avtorstvo. To ne pomeni, da mora biti človek edini avtor, mora pa biti njegov prispevek bistven. Povedano drugače: umetna inteligenca ne more biti nosilec avtorske pravice, to je lahko le človek (spomnimo se na opice).

Vsakršna stvaritev umetne inteligence torej ni a priori izključena, mora pa človek dokazati, kako je sodeloval in zakaj brez njega izdelka ne bi bilo. Ločnica ni enostavna, nedorečenosti pa je še toliko, da tudi Getty Images ne dovoljuje vsebin, ki jih je ustvarila umetna inteligenca, ker ne vedo, kako jih obravnavati.

Umetnik Kris Kashtanova je te dni uspel to dokazati. Urad za avtorske pravice je odobril registracijo stripa Zarya of the Dawn, ki ga je bil Kashtanova ustvaril z orodjem Midjourney. To je komercialno dostopno orodje za ustvarjanje slik. Pri tem je...

19 komentarjev

DALL-E zna sliko nadaljevati izven okvirjev

openai.com - V družbi za razvoj strojnega učenja OpenAI so predstavili novo zmogljivost svojega algoritma za generiranje slik DALL-E: vzorčno podobo zna z nekaj tekstovne pomoči nadaljevati izven prvotnih okvirjev.

Strojno generiranje podob iz tekstovnih navodil je trenutno eno najzanimivejših področij strojnega učenja. Ne zgolj zaradi bliskovitega napredka, saj novi algoritmi v tehnološko tekmo vstopajo skorajda mesečno, temveč tudi zaradi stvarnega učinka v praksi. Rešitve so se namreč že pririnile v dejanske izdelke; tako je TikTok sredi avgusta predstavil samodejno ustvarjanje risanih ozadij, ki se sicer ne more primerjati s slikarijami s čela napredka, a to niti ni namen. Tudi že lahko vidimo učinek na področje likovne umetnosti, saj se algoritmi že aktivno uporabljajo kot orodje, kar sproža vrsto polemik tako glede avtorstva kakor realne umetniške vrednosti slik, ki so bile ustvarjene s strojno pomočjo. Segment je torej sredi zelo aktivnega razvoja - in laboratoriji za strojno pamet so...

12 komentarjev