Zakaj se generatorji slik z umetno inteligenco trudijo z rokami

Zakaj se generatorji slik z umetno inteligenco trudijo z rokami
Bralci, kot ste vi, pomagajo podpirati MUO. Ko opravite nakup prek povezav na našem spletnem mestu, lahko zaslužimo partnersko provizijo. Preberi več.

Generatorji umetne inteligence se razvijajo pred našimi očmi s strašljivo hitrostjo, vendar imajo še vedno pomanjkljivosti. Opazovanje nenavadnih podrobnosti na slikah AI je pravzaprav zelo smešno. Zato so roke Midjourney postale vroča tema, težava, ki je pogosta pri mnogih motorjih.





Poglejmo, zakaj roke tako močno izzivajo generatorje slik z umetno inteligenco. Njihovi programerji že odpravljajo to meme vredno težavo, vendar je zanimivo razmišljati o tem, kako se umetna inteligenca uči, da ne omenjamo, kaj ji stoji na poti.





MAKEUSEOF VIDEO DNEVA POMIKITE SE ZA NADALJEVANJE Z VSEBINO

Zakaj so roke, ustvarjene z umetno inteligenco, vznemirile

Kdorkoli uporablja mehanizme umetne inteligence za ustvarjanje slik, je morda opazil, da roke redko pridejo prav, toda težava je obrnila glavo, ko se je na Twitterju pojavil kup 'fotografij'.





Ob natančnejšem pregledu so jih čudne roke ljudi izdale kot slike, ki jih je ustvarila umetna inteligenca. Dejstvo, da je bil to poskus Midjourneyja, je naredilo situacijo bolj zanimivo.

Eden najboljših mehanizmov umetne inteligence se ni mogel spopasti z zapletenostjo človeških rok, zato so bile zmogljivosti Midjourneyja in njegovih konkurentov na preizkušnji. Res je, celo DALL-E je nagnjen k nerealnim prstom in nohtom.



  ljudi, ki se rokujejo na DALL-E

Pomp je bil nesorazmeren, če upoštevamo, da so roke, ki jih ustvari umetna inteligenca, vedno predstavljale težavo, vendar je dodatna pozornost spodbudila izdajo Midjourney v5 za izboljšanje v4 .

sinhronizirajte fotografije na facebooku s stiki android

Nova različica je poudarila izboljšavo oblikovanja rok, kar je jasen znak, da so inženirji AI pozorni na smešno vznemirjenje in se odločili nadgraditi zmogljivosti programske opreme.





Drugi motorji počasi sledijo Midjourneyjevemu zgledu, torej popravljanje AI umetnosti s Photoshopom ostaja neprecenljiva veščina. Glavna ovira za programerje je, kako zapleteno je usposobiti umetno inteligenco za risanje prepričljivih rok.

Zakaj se generatorji slik AI trudijo z rokami?

Motorji AI za ustvarjanje slik uporabljajo generativna kontradiktorna omrežja (GAN) ali stabilno difuzijo. Obe tehnologiji zahtevata obsežne izvorne materiale, usposabljanje in procesorsko moč za ustvarjanje celo najosnovnejših umetniških del.





Ker so že obstoječe slike osrednjega pomena za usposabljanje umetne inteligence, morajo programerji svoji programski opremi dati na tisoče, če ne milijone, slik poleg pozivov – postopek ponavljajo znova in znova, dokler motor ne razume, na kaj se določena beseda nanaša in kako jo predstavi ta predmet.

Toda izvorne slike, iz katerih se AI uči, so večinoma 2D, kjer so roke upodobljene v različnih položajih. Naj bo raven ali zavit, s petimi ali tremi prsti.

poiščite spletna mesta, povezana z e -poštnim naslovom

Konec koncev stroj dejansko ne razume koncepta rok in slike, iz katerih se uči, rok ne prikazujejo vedno jasno ali dovolj dosledno. Zato so lahko roke Midjourney tako grde: zmeda AI.

Tako velja kot Zaskrbljenost Elona Muska glede razvoja umetne inteligence morda se je treba nekaterih delov tehnologije še veliko naučiti. In njihove ovire presegajo nezadostne zglede rok.

Drugi razlogi, zakaj se AI generatorji slik počasi izboljšujejo

  Ženska kodira na računalniku

Gledati Midjourneyjevi modeli , v5 ponuja napredno skladnost med besedilnimi pozivi in ​​proizvedenimi slikami ter višjo ločljivost in dodatna orodja. Toda takšni dosežki niso poceni.

Usposabljanje umetne inteligence za boljše delo z rokami zahteva vnos boljših slik, zlasti v 3D. To pomeni, da se veliko časa in delovne sile porabi za procese, od pridobivanja izvornih materialov do izboljšanja kodiranja in ponavljanja usposabljanja, dokler umetna inteligenca ne uspe.

Tudi takrat lahko programska oprema naredi napake pri sicer osupljivih umetninah. Poleg tega, da je veliko in zapleteno delo, je drago. Torej, ne pričakujte brezplačni AI generatorji besedila v sliko da še stopite do Midjourneyjevega kalibra.

Preprosto povedano, težava z motorji AI ni le v nezmožnosti teh računalniških programov, da bi popolnoma razumeli, kako izgledajo ali delujejo človeške lastnosti, kot so roke in noge. Prav tako je odvisno od stroškov in dostopa tehnologije do 3D-slik in tehnik strojnega učenja, ki lahko generatorjem pomagajo do bolj realističnega razumevanja sveta okoli sebe.

bo tiktok prepovedan v ZDA

Generatorji slik z umetno inteligenco se ne bodo borili večno

Roke so zapleten koncept za umetno inteligenco, da bi ovila svojo binarno glavo, vendar so rešitve problema že na delu. Midjourney, DALL-E 2 in druge platforme bodo sčasoma lahko omejile nenavadne prste na minimum, če jih ne bodo popolnoma izkoreninile.

Napredek na drugih področjih umetne inteligence zagotavlja, da se tehnologija nenehno razvija, njeni razvijalci pa se vedno učijo novih načinov za njeno uporabo in izboljšanje.