5 najboljših odprtokodnih generatorjev slik z umetno inteligenco

hitre povezave

Barvica

Stabilna difuzija 1.5

DreamShaper

InvokeAI

Openjourney

Modeli za ustvarjanje besedila v sliko, ki temeljijo na umetni inteligenci, so povsod in vsak dan postajajo lažji dostop. Čeprav je enostavno samo obiskati spletno stran in ustvariti sliko, ki jo iščete, so odprtokodni generatorji besedila v sliko vaša najboljša izbira, če želite več nadzora nad procesom ustvarjanja.

MAKEUSEOF VIDEO DNEVA POmaknite se ZA NADALJEVANJE Z VSEBINO

V internetu je na voljo na desetine brezplačnih in odprtokodnih generatorjev besedila v sliko z umetno inteligenco, ki so specializirani za posebne vrste slik. Tako smo prebrskali kup in našli najboljše odprtokodne generatorje besedila v sliko z umetno inteligenco, ki jih lahko preizkusite zdaj.

1 Barvica

Craiyon je eden najlažje dostopnih odprtokodnih generatorjev slik z umetno inteligenco. Temelji na DALL-E Mini, medtem ko ga lahko klonirate Github repozitorij in namestite model lokalno na vaš računalnik, se zdi, da je Craiyon opustil ta pristop v korist svojega spletnega mesta.

Uradno Githubovo skladišče ni bilo posodobljeno od junija 2022, vendar je najnovejši model še vedno na voljo brezplačno na uradna stran Craiyon . Prav tako ni aplikacij za Android ali iOS.

Kar zadeva funkcionalnost, boste videli vse običajne možnosti, ki jih pričakujete od generatorja slik z umetno inteligenco. Ko vnesete svoj poziv in prejmete sliko, lahko uporabite funkcijo upscale, da dobite kopijo z višjo ločljivostjo. Izbirate lahko med tremi slogi: umetnost, fotografija in risba. Izberete lahko tudi možnost »Brez«, če želite, da odloča model.

Poleg tega vam »strokovni način« omogoča vključitev negativnih besed, kar modelu pove, naj se izogiba določenim predmetom. Obstaja tudi funkcija napovedovanja poziva, ki uporablja ChatGPT, da uporabnikom pomaga napisati najboljše in najbolj podrobne možne pozive. Nazadnje, funkcije za odstranjevanje ozadja, ki jih poganja AI, vam lahko pomagajo prihraniti čas in trud pri izrezovanju ozadij iz slik.

In to je približno vse, kar počne Craiyon. To ni najbolj izpopolnjen model generiranja slik z umetno inteligenco, vendar se dobro obnese kot osnovni model, če ne želite nekaj podrobnega ali realističnega.

Model je brezplačen za uporabo, vendar so brezplačni uporabniki omejeni na devet brezplačnih slik hkrati v eni minuti. Lahko se naročite na njihove podporne ali profesionalne ravni (po ceni 5 USD oziroma 20 USD na mesec in zaračunavanje letno), da ne dobite oglasov ali vodnih žigov, hitrejše ustvarjanje in možnost, da vaše ustvarjene slike ostanejo zasebne. Stopnja naročnine po meri omogoča tudi modele po meri, integracijo, namensko podporo in zasebne strežnike.

samodejno posreduje besedilna sporočila po e -pošti

2 Stabilna difuzija 1.5

Stable Diffusion je morda eden najbolj priljubljenih odprtokodnih modelov generiranja besedila v sliko. Poganja tudi druge modele, vključno s tremi spodaj omenjenimi generatorji slik. Izdan je bil leta 2022 in od takrat je imel veliko implementacij.

Prihranil vam bom preveč tehnične podrobnosti o delovanju modela (za kar si lahko ogledate njihove uradno skladišče Github ), vendar je model enostaven za namestitev tudi za popolne začetnike in deluje dobro, če imate namensko GPE z vsaj 4 GB pomnilnika. Lahko tudi dostopate Stabilna difuzija na spletu in mi vam nudimo pomoč, če želite zaženite Stable Diffusion na Macu .

Na voljo je več kontrolnih točk (upoštevajte jih različice), ki jih lahko uporabite za stabilno difuzijo. Medtem ko smo preizkušali različico 1.5, različica 2.1 je tudi v aktivnem razvoju in je bolj natančen.

Yadullah Abidi/MakeUseOf/DreamShaper

Tudi vodenje modela je precej enostavno. Preizkusili smo ga z AUTOMATIC1111 Stable Diffusion spletni uporabniški vmesnik , vse kontrole in parametri pa dobro delujejo. Prav tako je precej odporen na NSFW, zahvaljujoč bazi podatkov LAION-5B, na kateri se je model uril (čeprav ni popolna, ne pozabite). Medtem ko se sam čas generiranja razlikuje glede na vašo strojno opremo, lahko pričakujete, da bodo vaše slike podrobne in realistične tudi z osnovnimi pozivi.

3 DreamShaper

DreamShaper je model za ustvarjanje slike, ki temelji na stabilni difuziji. Zamišljen je bil kot odprtokodna alternativa MidJourneyju in se osredotoča na fotorealizem v ustvarjenih slikah, čeprav lahko z nekaj prilagoditvami enako dobro obvlada sloge animejev in slikanja.

Model je zmogljivejši od Stable Diffusion, kar uporabnikom omogoča več svobode nad končnim rezultatom, od bliskovitih izboljšav do ohlapnejših omejitev NSFW. Vodenje modela je tudi enostavno, z a na voljo je naložljiva, predhodno usposobljena različica na spletu za lokalni dostop in številne spletne strani, vključno z Sinkin.ai , RandomSeed , in Mage.space (zahteva osnovno naročnino), ki vam omogoča zagon modela s pospeškom GPU.

Kot verjetno že ugibate, so slike, ki jih ustvari DreamShaper, videti bolj realistične v primerjavi s Stable Diffusion. Tudi če zaženete isti poziv na obeh modelih, bo model DreamShaper verjetno bolj realističen, podroben in bolje osvetljen.

To še posebej velja za portrete ali like, kar se mi je zdelo manjkajoče v Stable Diffusion v primerjavi z istim pozivom. Če vaše slike postanejo preveč realistične, so tukaj štirje načini prepoznavanja slike, ustvarjene z umetno inteligenco .

Tudi za zagon modela ne potrebujete velikega računalnika. Moja GTX 1650Ti s 4 GB VRAM-a je odlično poganjala model. Čas generiranja je bil nekoliko daljši, vendar se zdi, da to ni vplivalo na dejanski rezultat. Kljub temu boste morda potrebovali GPE z več VRAM-a za zagon DreamShaper XL, ki temelji na modelu Stable Diffusion XL.

4 InvokeAI

Invoke AI je še en model generiranja slik, ki temelji na umetni inteligenci in temelji na Stable Diffusion, z različico XL, ki temelji na Stable Diffusion XL. Ima tudi lasten uporabniški vmesnik za splet in ukazno vrstico, kar pomeni, da vam ne bo treba preskočiti stvari, kot je spletni uporabniški vmesnik Stable Diffusion.

Model se osredotoča na to, da uporabnikom omogoča ustvarjanje vizualnih elementov na podlagi njihove intelektualne lastnine s prilagojenimi poteki dela. InvokeAI je eden najboljših odprtokodnih modelov generiranja slik AI za usposabljanje modelov po meri in delo z intelektualno lastnino.

Njegovo uradno skladišče Github navaja dva načina namestitve: namestitev prek namestitvenega programa InvokeAI ali uporaba PyPI, če ste zadovoljni s terminalom in Pythonom in potrebujete več nadzora nad paketi, nameščenimi z modelom.

Vendar pa dodatni nadzor prinaša nekaj omejitev, predvsem strožje zahteve glede strojne opreme. InvokeAI priporoča namenski grafični procesor z vsaj 4 GB pomnilnika, pri čemer se priporoča šest do osem GB za izvajanje različice XL. Zahteve za VRAM veljajo za grafične procesorje AMD in Nvidia. Potrebovali boste tudi vsaj 12 GB RAM-a in 12 GB prostega prostora na disku za model, njegove odvisnosti in Python.

Yadullah Abidi/MakeUseOf/InvokeAI

Medtem ko dokumentacija ne priporoča grafičnih procesorjev Nvidia GTX serije 10 in serije 16 zaradi pomanjkanja video pomnilnika, je priloženi namestitveni program deloval dobro. Čeprav se vaša kilometrina lahko razlikuje, če uporabljate GPE nižjega razreda, pričakujte, da boste čakali dlje, da se vaši pozivi spremenijo v slike. Nazadnje, če uporabljate Windows, lahko uporabljate samo GPE Nvidia, saj trenutno ni podpore za GPE AMD.

Za del ustvarjanja slike se model bolj nagiba k umetniškim slogom kot k fotorealizmu. Seveda lahko model usposobite na svojem naboru podatkov in ustvarite slike, ki so bližje želenemu, tudi če to vključuje fotorealistične slike, zlasti če delate na področju oblikovanja izdelkov, arhitekture ali maloprodajnih prostorov. Vendar pa morate upoštevati eno pomembno stvar, da je InvokeAI predvsem mehanizem za ustvarjanje slik, kar pomeni, da boste za najboljše rezultate verjetno morali uporabiti lastne modele (lahko jih najdete prek upravitelja modelov v spletnem vmesniku) kot privzeti model je precej podoben sami stabilni difuziji.

5 Openjourney

Openjourney je brezplačen, odprtokodni model za generiranje slik z umetno inteligenco, ki ponovno temelji na Stable Diffusion. Če se sprašujete, zakaj se model imenuje Openjourney, je to zato, ker je bil učen na slikah Midjourney in lahko posnema svoj slog v slikah, ki jih ustvari.

PromptHero , podjetje, ki stoji za Openjourney, vam omogoča testiranje modela skupaj z drugimi modeli, vključno s Stable Diffusion (različici 1.5 in 2), DreamShaper in Realistic Vision. Ob prijavi prejmete 25 brezplačnih kreditov (en kredit za vsako ustvarjeno sliko), nato pa se morate naročiti na njihovo naročniško raven Pro, ki stane 9 USD na mesec in vam omogoča dostop do 300 kreditov vsak mesec z drugimi ekskluzivnimi funkcijami.

Če pa ga želite izvajati lokalno in brezplačno, lahko prenesite datoteko modela iz HuggingFace in ga zaženite s spletnim uporabniškim vmesnikom Stable Diffusion. Openjourney je tudi drugi najbolj prenesen model generiranja slik z umetno inteligenco na HuggingFace, takoj za Stable Diffusion.

Openjourney na svojem spletnem mestu ne navaja posebnih zahtev glede strojne opreme za lokalno izvajanje modela, vendar lahko pričakujete podobne strojne zahteve kot Stable Diffusion. To pomeni namenski grafični procesor s 4 GB VRAM-a, 16 GB RAM-a in približno 12 do 15 GB prostega prostora v vašem računalniku za shranjevanje modela in njegovih odvisnosti.

Yadullah Abidi/MakeUseOf/OpenJourney

Slike, ki jih ustvari Openjourney, so običajno uravnotežene med fotorealizmom in umetnostjo, razen če ni določeno drugače. Če iščete vsestranski model in imate raje videz in občutek Midjourney brez plačila naročnine, je Openjourney ena najboljših možnosti.