Si ndryshon përmirësimi i madhësisë me anë të inteligjencës artificiale nga metodat tradicionale të ndryshimit të madhësisë?

Përmirësimi i inteligjencës artificiale parashikon mungesën e detajeve me rezolucion të lartë nga modelet ekzistuese në një imazh, në vend që thjesht të shtrijë pikselët siç bëjnë metodat tradicionale si interpolimi bikubik. Kjo rezulton në imazhe më të mprehta dhe më të detajuara.

Cilat janë defektet e zakonshme që duhet të kem parasysh kur përdor përmirësimin e inteligjencës artificiale?

Artefaktet e zakonshme përfshijnë aureola rreth skajeve, modele teksturash të përsëritura, faqe tepër të lëmuara ose të dyllta dhe tekst që transformohet në 'pothuajse shkronja'. Është e rëndësishme të monitorohen këto probleme për të siguruar një rezultat me pamje natyrale.

Pse fytyrat ndonjëherë duken shumë të lëmuara ose joreale pas përmirësimit të shkallës?

Fytyrat mund të duken tepër të lëmuara për shkak të heqjes së zhurmës dhe mprehjes agresive që mund të heqë teksturat si poret. Për të arritur një pamje më natyrale, merrni në konsideratë reduktimin e cilësimeve të heqjes së zhurmës dhe mprehjes.

Çfarë duhet të bëj nëse imazhet e mia duken të ashpra ose kanë zhurmë të tepërt pas përdorimit të përmirësimit të shkallës me anë të inteligjencës artificiale?

Nëse imazhet tuaja duken të mprehta, provoni të rregulloni rrëshqitësit e heqjes së zhurmës dhe përmirësimit të detajeve. Shtimi i kokrrizave delikate mund të ndihmojë gjithashtu në rikthimin e një ndjesie më fotografike.

Si krahasohen modelet GAN dhe CNN në rezultatet e përmirësimit të inteligjencës artificiale?

Modelet CNN janë përgjithësisht të qëndrueshme dhe të parashikueshme, ndërsa modelet GAN shpesh ofrojnë detaje më të mprehta, por rrezikojnë të fusin elementë jorealistë. Zgjedhja midis tyre varet nga nevoja juaj për realizëm kundrejt teksturës së përmirësuar.

A është përmirësimi i inteligjencës artificiale i përshtatshëm për përmbajtjen video dhe çfarë sfidash paraqet?

Po, përmirësimi i shkallëzimit me anë të inteligjencës artificiale është i përshtatshëm për video, por mund të jetë sfidues sepse qëndrueshmëria në të gjitha kuadro është thelbësore. Detajet e dridhjes ose shkëlqimit mund të shpërqendrojnë shikuesit, prandaj rekomandohen metoda të specializuara të fokusuara në video.

Kur nuk është e përshtatshme të mbështetemi në përmirësimin e inteligjencës artificiale?

Përmirësimi i inteligjencës artificiale duhet të përdoret me kujdes në skenarë me rreziqe të larta, siç janë gazetaria ose analiza mjeko-ligjore, ku saktësia është kritike. Është më mirë të trajtohet si përmirësim sesa si provë përfundimtare, dhe transparenca në lidhje me proceset e inteligjencës artificiale është thelbësore.

Çfarë konsideratash duhet të kem parasysh kur përmirësoj imazhet e kompresuara shumë?

Për imazhet që janë shumë të kompresuara, filloni me heqjen e artefakteve për të minimizuar çdo bllokim të padëshiruar. Pas kësaj, mund të përmirësoni shkallën dhe të aplikoni mprehje të lehtë nëse është e nevojshme për të ruajtur detajet pa amplifikuar artefaktet e kompresimit.

Si funksionon përmirësimi i inteligjencës artificiale? [Video dhe kuiz]

Përgjigje e shkurtër: Përmirësimi i inteligjencës artificiale funksionon duke trajnuar një model në imazhe të çiftëzuara me rezolucion të ulët dhe të lartë, dhe më pas duke e përdorur atë për të parashikuar pikselë shtesë të besueshëm gjatë përmirësimit. Nëse modeli ka parë tekstura ose fytyra të ngjashme në trajnim, ai mund të shtojë detaje bindëse; nëse jo, ai mund të "halucinojë" artefakte të tilla si aureola, lëkurë të dylltë ose shkrepje në video.

Përmbledhjet kryesore:

Parashikimi: Modeli gjeneron detaje të besueshme, jo një rindërtim të garantuar të realitetit.

Zgjedhja e modelit: CNN-të kanë tendencë të jenë më të qëndrueshme; GAN-të mund të duken më të mprehta, por rrezikojnë të shpikin veçori.

Kontrollet e artefakteve: Kushtojini vëmendje aureolave, teksturave të përsëritura, "pothuajse shkronjave" dhe fytyrave plastike.

Stabiliteti i videos: Përdorni metoda kohore ose do të shihni shkëlqim dhe zhvendosje nga njëra kornizë në tjetrën.

Përdorim me rrezik të lartë: Nëse saktësia ka rëndësi, zbuloni përpunimin dhe trajtojini rezultatet si ilustruese.

Si funksionon përmirësimi i inteligjencës artificiale? Infografik.

Me siguri e keni parë: një imazh i vogël dhe krokante shndërrohet në diçka mjaftueshëm të qartë për ta printuar, transmetuar ose hedhur në një prezantim pa u dridhur. Ndihet si mashtrim. Dhe - në kuptimin më të mirë - në një farë mënyre është 😅

Pra, mënyra se si funksionon përmirësimi i inteligjencës artificiale (IA Upscaling) reduktohet në diçka më specifike sesa "kompjuteri përmirëson detajet" (me dorë të valëzuar) dhe më afër "një model parashikon një strukturë të besueshme me rezolucion të lartë bazuar në modelet që ka mësuar nga shumë shembuj" (Deep Learning for Image Super-resolution: A Survey). Ky hap parashikimi është e gjithë loja - dhe kjo është arsyeja pse përmirësimi i inteligjencës artificiale mund të duket mahnitës... ose pak plastik... ose sikur macja juaj të ketë rritur mustaqe shtesë.

Artikuj që mund t'ju pëlqejnë të lexoni pas këtij:

🔗 Si funksionon inteligjenca artificiale
Mësoni bazat e modeleve, të dhënave dhe konkluzioneve në IA.

🔗 Si mëson inteligjenca artificiale
Shikoni se si të dhënat e trajnimit dhe reagimet përmirësojnë performancën e modelit me kalimin e kohës.

🔗 Si zbulon anomalitë IA
Kuptoni linjat bazë të modeleve dhe si inteligjenca artificiale sinjalizon shpejt sjelljen e pazakontë.

🔗 Si parashikon IA trendet
Eksploroni metodat e parashikimit që dallojnë sinjalet dhe parashikojnë kërkesën e ardhshme.

Si funksionon përmirësimi i inteligjencës artificiale: ideja kryesore, me fjalë të përditshme 🧩

Zmadhimi do të thotë rritje e rezolucionit: më shumë piksel, imazh më i madh. Zmadhimi tradicional (si bikubiku) në thelb i zgjat pikselët dhe i zbut tranzicionet (interpolimi bikubik). Është në rregull, por nuk mund të shpikë të reja - thjesht interpolon.

Përmirësimi i inteligjencës artificiale provon diçka më të guximshme (e njohur edhe si "super-rezolucion" në botën e kërkimit) (Mësim i Thellë për Super-rezolucionin e Imazhit: Një Sondazh):

Shikon hyrjen me rezolucion të ulët
Njeh modelet (skajet, teksturat, tiparet e fytyrës, vijat e tekstit, endjen e pëlhurës…)
Parashikon se si duhet të duket një version me rezolucion më të lartë
Gjeneron të dhëna shtesë pikselësh që i përshtaten këtyre modeleve

Jo "rivendos realitetin në mënyrë të përsosur", më shumë si "bëj një hamendje shumë të besueshme" (Rezolucioni i Imazhit me Super-Rezolucion Duke Përdorur Rrjete të Thella Konvolucionale (SRCNN)). Nëse kjo tingëllon paksa e dyshimtë, nuk gaboheni - por është edhe arsyeja pse funksionon kaq mirë 😄

Dhe po, kjo do të thotë që përmirësimi i inteligjencës artificiale është në thelb halucinacion i kontrolluar… por në një mënyrë produktive që respekton pikselët.

Çfarë e bën një version të mirë të përmirësimit të inteligjencës artificiale? ✅🛠️

Nëse po gjykoni një përmirësues të inteligjencës artificiale (ose një parazgjedhje), ja çfarë ka më shumë rëndësi:

Rikuperimi i detajeve pa i tepruar me gatimin.
Zmadhimi i mirë shton freski dhe strukturë, jo zhurmë krokante ose pore të rreme.
Disiplina në skaje.
Linjat e pastra mbeten të pastra. Modelet e këqija bëjnë që skajet të lëkunden ose të dalin aureola.
Realizmi i teksturës.
Flokët nuk duhet të bëhen një goditje me penel. Tulla nuk duhet të bëhet një stampë modeli që përsëritet.
Trajtimi i zhurmës dhe kompresimit.
Shumë imazhe të përditshme modifikohen në formatin JPEG deri në vdekje. Një modifikim i mirë për shkallëzimin nuk e amplifikon këtë dëm (Real-ESRGAN).
Ndërgjegjësimi për fytyrën dhe tekstin
Fytyrat dhe teksti janë vendet më të lehta për të dalluar gabimet. Modelet e mira i trajtojnë ato me butësi (ose kanë mënyra të specializuara).
Konsistencë nëpër kuadro (për video)
Nëse detajet dridhen nga njëra kornizë në tjetrën, sytë tuaj do të bërtasin. Përmirësimi i shkallëzimit të videos jeton ose vdes nga stabiliteti kohor (BasicVSR (CVPR 2021)).
Kontrolle që kanë kuptim.
Ju dëshironi rrëshqitës që lidhen me rezultate reale: heqja e zhurmës, heqja e turbullirave, heqja e objekteve, ruajtja e kokrrizave, mprehja… gjërat praktike.

Një rregull i qetë që vlen: përmirësimi "më i mirë" është shpesh ai që mezi e vëren. Thjesht duket sikur ke pasur një aparat fotografik më të mirë që në fillim 📷✨

Tabela Krahasuese: opsionet më të njohura të përmirësimit të inteligjencës artificiale (dhe për çfarë janë të mira) 📊🙂

Më poshtë është një krahasim praktik. Çmimet janë qëllimisht të paqarta sepse mjetet ndryshojnë në varësi të licencës, paketave, kostove të llogaritjes dhe të gjitha gjërave argëtuese.

Mjet / Qasje	Më e mira për	Atmosfera e çmimeve	Pse funksionon (përafërsisht)
Pajisje për përmirësim të shkallëve të punës në stilin Topaz (Topaz Photo, Topaz Video)	Foto, video, rrjedhë pune e lehtë	Me pagesë	Modele të forta të përgjithshme + shumë akordim, kanë tendencë të "funksionojnë"... kryesisht
Karakteristikat e tipit "Super Resolution" të Adobe (Adobe Enhance > Super Resolution)	Fotografë që janë tashmë në atë ekosistem	Abonim-y	Rindërtim i detajuar i fortë, zakonisht konservator (më pak dramatik)
Variantet Real-ESRGAN / ESRGAN (Real-ESRGAN, ESRGAN)	Bëje vetë, zhvillues, punë në grup	Falas (por që kërkon kohë)	I shkëlqyer në detajet e teksturës, mund të jetë pikant në fytyra nëse nuk jeni të kujdesshëm
Modalitetet e rritjes së shkallëzimit të bazuara në difuzion (SR3)	Punë krijuese, rezultate të stilizuara	Të përziera	Mund të krijojë detaje të mrekullueshme - gjithashtu mund të shpikë gjëra të pakuptimta, kështu që… po
Përmirësues të nivelit të lojërave (stili DLSS/FSR) (NVIDIA DLSS, AMD FSR 2)	Lojëra dhe renderime në kohë reale	I paketuar	Përdor të dhëna lëvizjeje dhe të dhëna paraprake të mësuara - fitore në performancë të qetë 🕹️
Shërbime për përshkallëzim të cloud-it	Komoditet, fitore të shpejta	Pagesë për përdorim	I shpejtë + i shkallëzueshëm, por shkëmbeni kontroll dhe ndonjëherë hollësi
Përmirësues të inteligjencës artificiale të fokusuar në video (BasicVSR, Topaz Video)	Pamje të vjetra, anime, arkiva	Me pagesë	Truke të përkohshme për të zvogëluar shkrepjen + modele të specializuara video
Përmirësim i shkallëzimit të telefonit/galerisë “të zgjuar”	Përdorim i rastësishëm	Përfshirë	Modele të lehta të akorduara për rezultate të këndshme, jo për përsosmëri (ende të dobishme)

Rrëfim i çuditshëm i formatimit: "Paid-ish" po bën shumë punë në atë tabelë. Por e kuptoni idenë 😅

Sekreti i madh: modelet mësojnë një përputhje nga rezolucioni i ulët në atë të lartë 🧠➡️🖼️

Në zemër të shumicës së përmirësimeve të inteligjencës artificiale është një konfigurim i të mësuarit të mbikëqyrur (Super-Rezolucioni i Imazhit Duke Përdorur Rrjete të Thella Konvolucionale (SRCNN)):

Filloni me imazhe me rezolucion të lartë ("e vërteta")
Ulni numrin e mostrave në versione me rezolucion të ulët ("hyrja")
Trajnoni një model për të rindërtuar rezolucionin origjinal të lartë nga ai i ulët

Me kalimin e kohës, modeli mëson korrelacione si:

“Ky lloj turbullimi rreth syrit zakonisht i përket qerpikëve”
"Ky grumbull pikselësh shpesh tregon tekst serif"
“Ky gradient skaji duket si një vijë në çati, jo si një zhurmë e rastësishme”

Nuk është memorizim i imazheve specifike (në kuptimin e thjeshtë), është mësim i strukturës statistikore (Mësim i Thellë për Super-rezolucionin e Imazhit: Një Anketë). Mendojeni si të mësoni gramatikën e teksturave dhe skajeve. Jo gramatikë poezie, më shumë si… gramatikë manuale IKEA 🪑📦 (metaforë e ngathët, por mjaftueshëm e ngushtë).

Çështjet kryesore: çfarë ndodh gjatë inferencës (kur përmirësohesh) ⚙️✨

Kur futni një imazh në një përditësues të inteligjencës artificiale, zakonisht ekziston një rrjedhë si kjo:

Parapërpunim
- Konvertoni hapësirën e ngjyrave (ndonjëherë)
- Normalizoni vlerat e pikselëve
- Ndani imazhin në copa nëse është i madh (kontroll i realitetit VRAM 😭) (Repo Real-ESRGAN (opsionet e pllakave))
Nxjerrja e veçorive
- Shtresat e hershme zbulojnë skajet, qoshet, gradientët
- Shtresat më të thella zbulojnë modelet: teksturat, format, përbërësit e fytyrës
Rindërtim
- Modeli gjeneron një hartë të veçorive me rezolucion më të lartë
- Pastaj e konverton atë në daljen aktuale të pikselëve
Përpunimi pasues
- Mprehje opsionale
- Zvogëlim opsional i zhurmës
- Shtypja opsionale e artefakteve (zile, halo, bllokim)

Një detaj delikat: shumë mjete i japin pllakave një pamje më të mirë, pastaj i përziejnë qepjet. Mjete të shkëlqyera fshehin kufijtë e pllakave. Mjetet mekanike lënë shenja të zbehta rrjete nëse i mbyllni sytë. Dhe po, do t'i mbyllni sytë, sepse njerëzve u pëlqen të inspektojnë papërsosmëritë më të vogla me një zmadhim prej 300%, si gremlinët e vegjël 🧌

Familjet kryesore të modeleve të përdorura për përmirësimin e inteligjencës artificiale (dhe pse ato duken të ndryshme) 🤖📚

1) Superrezolucion i bazuar në CNN (kari klasik i punës)

Rrjetet nervore konvolucionale janë të shkëlqyera në modelet lokale: skajet, teksturat, strukturat e vogla (Super-Rezolucioni i Imazhit Duke Përdorur Rrjetet e Thella Konvolucionale (SRCNN)).

Përparësitë: pak i shpejtë, i qëndrueshëm, më pak surpriza
Kundër: mund të duket pak "i përpunuar" nëse shtyhet fort

2) Përmirësim i bazuar në GAN (stili ESRGAN) 🎭

GAN-et (Rrjetet Kundërshtare Gjenerative) stërvisin një gjenerator për të prodhuar imazhe me rezolucion të lartë që një diskriminues nuk mund t'i dallojë nga ato reale (Rrjetet Kundërshtare Gjenerative).

Përparësitë: detaje të forta, teksturë mbresëlënëse
Kundër: mund të shpikë detaje që nuk ishin aty - ndonjëherë të gabuara, ndonjëherë të çuditshme (SRGAN, ESRGAN)

Një GAN mund t'ju japë atë mprehtësi që të lë pa fjalë. Gjithashtu mund t'i japë subjektit të portretit tuaj një vetull shtesë. Pra… zgjidhni betejat tuaja 😬

3) Përmirësim i bazuar në difuzion (karta karakteristike krijuese) 🌫️➡️🖼️

Modelet e difuzionit çzhurmojnë hap pas hapi dhe mund të udhëzohen për të prodhuar detaje me rezolucion të lartë (SR3).

Përparësitë: mund të jetë jashtëzakonisht i mirë në detaje të besueshme, veçanërisht për punën krijuese
Kundër: mund të largohet nga identiteti/struktura origjinale nëse cilësimet janë agresive (SR3)

Këtu fillon të përzihet "përmirësimi" me "riimagjinimin". Ndonjëherë kjo është pikërisht ajo që dëshironi. Ndonjëherë jo.

4) Përmirësim i videos me qëndrueshmëri kohore 🎞️

Përmirësimi i shkallëzimit të videos shpesh shton logjikë të ndërgjegjshme për lëvizjen:

Përdor kornizat fqinje për të stabilizuar detajet (BasicVSR (CVPR 2021))
Përpiqet të shmangë dridhjet dhe artefaktet zvarritëse
Shpesh kombinon super-rezolucionin me heqjen e zhurmës dhe heqjen e ndërthurjes (Topaz Video)

Nëse përmirësimi i imazhit është si restaurimi i një pikture, përmirësimi i videos është si restaurimi i një libri pa e bërë hundën e personazhit të ndryshojë formë në çdo faqe. Gjë që është… më e vështirë nga ç’duket.

Pse përmirësimi i inteligjencës artificiale ndonjëherë duket i rremë (dhe si ta dalloni) 👀🚩

Përmirësimi i inteligjencës artificiale dështon në mënyra të dallueshme. Pasi t'i mësoni modelet, do t'i shihni kudo, si kur blini një makinë të re dhe papritur e vini re atë model në çdo rrugë 😵💫

E zakonshme tregon:

Depilim i lëkurës në fytyrë (shumë zhurmë + zbutje)
Aureola të mprehta tepër rreth skajeve (territori klasik i "tejkalimit") (interpolim bikubik)
Tekstura të përsëritura (muret me tulla bëhen modele kopjimi-ngjitjeje)
Mikro-kontrast i fortë që bërtet "algoritëm"
Shtrembërim teksti ku shkronjat bëhen pothuajse shkronja (lloji më i keq)
Zhvendosje detajesh ku veçoritë e vogla ndryshojnë pak, veçanërisht në rrjedhat e punës së difuzionit (SR3)

Pjesa delikate: ndonjëherë këto objekte duken "më mirë" me një shikim. Trurit tënd i pëlqen mprehtësia. Por pas një çasti, ndihet... i çuditshëm.

Një taktikë e mirë është të zmadhosh dhe të kontrollosh nëse duket natyrale në distancë normale shikimi. Nëse duket mirë vetëm me zmadhim 400%, kjo nuk është fitore, është hobi 😅

Si funksionon përmirësimi i inteligjencës artificiale: ana e trajnimit, pa dhimbjen e kokës së matematikës 📉🙂

Trajnimi i modeleve me superrezolucion zakonisht përfshin:

Sete të dhënash të çiftëzuara (hyrje me rezolucion të ulët, objektiv me rezolucion të lartë) (Super-Rezolucion Imazhesh Duke Përdorur Rrjete të Thella Konvolucionale (SRCNN))
Funksionet e humbjes që ndëshkojnë rindërtimet e gabuara (SRGAN)

Llojet tipike të humbjeve:

Humbja e pikselëve (L1/L2)
Inkurajon saktësinë. Mund të prodhojë rezultate paksa të dobëta.
Humbja perceptuese
krahason tipare më të thella (si "a duket e ngjashme") në vend të pikselëve të saktë (Humbjet perceptuese (Johnson et al., 2016)).
Humbja kundërshtare (GAN)
inkurajon realizmin, ndonjëherë me koston e saktësisë së mirëfilltë (SRGAN, Rrjetet Kontradiktore Gjenerative).

Ka një tërheqje litari të vazhdueshme:

Bëjeni besnik ndaj origjinalit
vs.
Bëjeni vizualisht të këndshëm

Mjete të ndryshme gjejnë vend në vende të ndryshme në atë spektër. Dhe mund të preferoni një të tillë në varësi të faktit nëse po restauroni foto familjare apo po përgatitni një poster ku "pamja e mirë" ka më shumë rëndësi sesa saktësia mjeko-ligjore.

Flukse pune praktike: foto, skanime të vjetra, anime dhe video 📸🧾🎥

Foto (portrete, peizazhe, pamje të produkteve)

Praktika më e mirë është zakonisht:

Së pari hiqni pak zhurmë (nëse është e nevojshme)
Luksoz me ambiente konservatore
Shtoni përsëri kokrriza nëse gjërat ndihen shumë të lëmuara (po, me të vërtetë)

Drithërat janë si kripa. Shumë e prishin darkën, por asnjëra nuk mund të ketë shije pak të zbehtë 🍟

Skanime të vjetra dhe imazhe shumë të kompresuara

Këto janë më të vështira sepse modeli mund t'i trajtojë blloqet e kompresimit si "teksturë".
Provoni:

Heqja ose zhbllokimi i artefakteve
Pastaj luksoze
Pastaj mprehje e dritës (jo shumë… e di, të gjithë e thonë këtë, por prapëseprapë)

Anime dhe art linear

Arti i vijave përfiton nga:

Modele që ruajnë skajet e pastra
Halucinacion i reduktuar i teksturës.
Përmirësimi i shkallëzimit të anime-ve shpesh duket shkëlqyeshëm sepse format janë më të thjeshta dhe konsistente. (Me fat.)

Video

Videoja shton hapa shtesë:

Zhurmë
Deinterlace (për burime të caktuara)
Luksoze
Zbutja ose stabilizimi kohor (BasicVSR (CVPR 2021))
Rifutja opsionale e drithërave për kohezion

Nëse e anashkalon qëndrueshmërinë kohore, do të përjetosh atë shkëlqim detaji. Pasi ta vëresh, nuk mund ta heqësh qafe. Si një karrige që kërcet në një dhomë të qetë 😖

Zgjedhja e cilësimeve pa hamendësuar shumë (një fletë e vogël mashtrimi) 🎛️😵💫

Ja një mentalitet i mirë fillestar:

Nëse fytyrat duken plastike,
zvogëloni zhurmën, zvogëloni mprehtësinë, provoni një model ose modalitet që ruan fytyrën.
Nëse teksturat duken shumë intensive,
ulni rrëshqitësit për "përmirësimin e detajeve" ose "rikuperimin e detajeve", shtoni kokrriza delikate pas tyre.
Nëse skajet shkëlqejnë,
ulni mprehjen, kontrolloni opsionet e shtypjes së halo-s.
Nëse imazhi duket shumë "me inteligjencë artificiale",
veproni më konservatorisht. Ndonjëherë lëvizja më e mirë është thjesht… më pak.

Gjithashtu: mos e zmadho 8x vetëm sepse mundesh. Një 2x ose 4x i pastër është shpesh pika ideale. Përtej kësaj, po i kërkon modelit të shkruajë një histori fansash rreth pikselëve të tu 📖😂

Etika, autenticiteti dhe pyetja e sikletshme e "së vërtetës" 🧭😬

Përmirësimi i inteligjencës artificiale e zbeh një vijë ndarëse:

Restaurimi nënkupton rikthimin e asaj që ishte aty
Përmirësimi nënkupton shtimin e asaj që nuk ishte

Me fotot personale, zakonisht është në rregull (dhe e mrekullueshme). Me gazetarinë, provat ligjore, imazherinë mjekësore ose çdo gjë ku besnikëria ka rëndësi… duhet të jeni të kujdesshëm (OSAC/NIST: Udhëzuesi Standard për Menaxhimin e Imazheve Dixhitale Forenzike, Udhëzimet SWGDE për Analizën e Imazheve Forenzike).

Një rregull i thjeshtë:

Nëse rreziqet janë të larta, trajtojeni përmirësimin e inteligjencës artificiale si ilustrues, jo si përfundimtar.

Gjithashtu, zbulimi ka rëndësi në kontekstet profesionale. Jo sepse inteligjenca artificiale është e keqe, por sepse audienca meriton të dijë nëse detajet janë rindërtuar apo janë kapur. Kjo është thjesht… respekt.

Shënime përmbyllëse dhe një përmbledhje e shpejtë 🧡✅

Pra, mënyra se si funksionon përmirësimi i inteligjencës artificiale është kjo: modelet mësojnë se si detajet me rezolucion të lartë tentojnë të lidhen me modelet me rezolucion të ulët, pastaj parashikojnë pikselë shtesë të besueshëm gjatë përmirësimit (Mësim i Thellë për Super-rezolucionin e Imazhit: Një Sondazh). Në varësi të familjes së modelit (CNN, GAN, difuzion, video-temporal), ky parashikim mund të jetë konservator dhe besnik… ose i guximshëm dhe ndonjëherë i çrregullt 😅

Përmbledhje e shpejtë

Rritja tradicionale e shkallëzimit zgjeron pikselët (interpolimi bikubik)
Përmirësimi i inteligjencës artificiale parashikon detajet që mungojnë duke përdorur modele të mësuara (Super-Rezolucioni i Imazhit Duke Përdorur Rrjete të Thella Konvolucionale (SRCNN))
Rezultate të shkëlqyera vijnë nga modeli i duhur + vetëpërmbajtja
Shikoni për aureola, faqe dylli, tekstura të përsëritura dhe shkrepje në video (BasicVSR (CVPR 2021))
Rritja e shkallëzimit është shpesh "rindërtim i besueshëm", jo e vërteta e përsosur (SRGAN, ESRGAN)

Nëse do, më trego çfarë po përmirëson (fytyra, foto të vjetra, video, anime, skanime teksti) dhe unë do të sugjeroj një strategji cilësimesh që tenton të shmangë kurthet e zakonshme të "pamjes së inteligjencës artificiale" 🎯🙂

Shembull nga bota reale: Përmirësimi i fotove të produkteve të vjetra në treg 📸

Skenari

Një dyqan i vogël kamerash të dorës së dytë ka 40 foto produktesh të eksportuara nga një faqe interneti e vjetër me gjerësi 800 px. Pronari dëshiron t'i ripërdorë ato në një faqe të re të tregtisë elektronike, ku madhësia e rekomanduar e imazhit është 1,600 px e gjerë.

Problemi: ndryshimi normal i madhësisë i bën kamerat të duken të buta, ndërsa rritja agresive e inteligjencës artificiale mund t'i bëjë dorezat prej gome, numrat serialë dhe shenjat e lenteve të duken të dyshimta. Kjo ka rëndësi sepse blerësit mbështeten në këto detaje para blerjes.

Qëllimi nuk është të “rikthehet” informacioni që mungon në mënyrë të përsosur. Qëllimi është të krijohen imazhe më të pastra të listave, duke i mbajtur skedarët origjinalë në dispozicion, sepse përmirësimi i inteligjencës artificiale parashikon detaje të besueshme në vend të të vërtetës së garantuar.

Çfarë nevojitet për rrjedhën e punës

Foto origjinale të produkteve, idealisht versionet më pak të kompresuara në dispozicion

Një madhësi rezultati e synuar, siç është një shkallëzim 2× nga 800px në 1,600px i gjerë

Një mjet ose model me kontrolle të ndara për heqjen e zhurmës, mprehjen dhe heqjen e artefakteve

Një listë e thjeshtë kontrolli për rishikime për tekstin, skajet, logot, vidat, butonat, fibrat e lëkurës dhe reflektimet

Një dosje për origjinalet dhe një dosje e veçantë për eksportet e modifikuara, kështu që asgjë nuk mbishkruhet

Shembull udhëzimi

Përdorni këtë lloj udhëzimi kur testoni një përmirësues të inteligjencës artificiale:

Rriteni këtë foto produkti 2× për një listë në tregtinë elektronike. Mbajeni formën e objektit, vendosjen e logos, shenjat e lenteve, skajet e butonave dhe strukturën e sipërfaqes sa më afër origjinalit të jetë e mundur. Përdorni pastrim me kompresim të butë, mprehje të ulët dhe shmangni shpikjen e tekstit shtesë, gërvishtjeve, etiketave, numrave serialë ose detajeve dekorative. Imazhi përfundimtar duhet të duket natyral në madhësinë normale të faqes së produktit, jo artificialisht i mprehtë në zmadhim 400%.

Si ta testoni

Filloni me pesë imazhe të përziera përpara se të përpunoni grupin e plotë:

Një foto e pastër produkti me ndriçim të mirë

Një imazh i kompresuar në JPEG me bllokim

Një foto me tekst të vogël të shtypur ose shenja lentesh

Një imazh i errët me zhurmë në hije

Një imazh me metal ose xham reflektues

Pas përmirësimit të shkallës, krahasoni çdo rezultat me origjinalin në 100% dhe 200%. Kontrolloni nëse emrat e markave, numratorët, vidat, portat dhe modelet e teksturës përputhen ende. Nëse modeli krijon "pothuajse shkronja" ose shenja të rreme në sipërfaqe, ulni cilësimin e mprehjes ose të rikuperimit të detajeve.

Rezultati

Rezultati ilustrues: bazuar në matjen e kohës së një testi me pesë imazhe para dhe pas përdorimit të këtij fluksi pune.

Pastrimi manual dhe ndryshimi i madhësisë zgjati rreth 9 minuta për imazh, ose 45 minuta për pesë imazhe.

Fluksi i punës i ndihmuar nga inteligjenca artificiale zgjati rreth 3 minuta për imazh, ose 15 minuta për pesë imazhe.

Kjo është një kohë e llogaritur prej 30 minutash e kursyer në pesë imazhe, ose rreth 4 orë e kursyer në një grup prej 40 imazhesh.

Rezultati i kontrollit të cilësisë: 4 nga 5 imazhe e kaluan shqyrtimin e parë. Një imazh dështoi sepse zmadhuesi shtrembëroi tekstin e vogël të lentes, kështu që u ripërpunua me mprehtësi më të ulët dhe pa përmirësim të tekstit.

Metrika e vlefshme këtu nuk është thjesht "duket më qartë". Është: sa imazhe kalojnë një shqyrtim krah për krah pa detaje të shpikura?

Çfarë mund të shkojë keq

Modeli mund të shndërrojë pluhurin, blloqet JPEG ose gërvishtjet në teksturë "të vërtetë".

Teksti i vogël mund të bëhet tekst i rremë që duket i besueshëm derisa ta zmadhoni.

Shumë heqje e zhurmës mund ta bëjë gomën, lëkurën ose metalin e lëmuar të duken si dylli.

Mprehja e fortë mund të krijojë aureola rreth skajeve të produktit.

Përpunimi në seri mund të fshehë gabimet, prandaj shqyrtoni një mostër përpara se të eksportoni gjithçka.

Për tregtinë elektronike, rregulli më i sigurt është i thjeshtë: mos përdorni kurrë përmirësime me anë të inteligjencës artificiale për të fshehur dëmtimet, për të ndryshuar gjendjen ose për ta bërë një produkt të duket më i ri nga ç’është në të vërtetë.

Përgatitje praktike për të marrë me vete

Përmirësimi i inteligjencës artificiale funksionon më mirë kur e trajtoni si një hap të kontrolluar përfundimi, jo si një buton magjik riparimi. Përdorni cilësime konservative 2×, kontrolloni detajet për të cilat interesohen blerësit dhe mbani imazhin origjinal në mënyrë që versioni i redaktuar të mbetet i besueshëm.

Shembull nga bota reale: Përmirësimi i një videoje të vjetër stërvitore pa e bërë atë të shkëlqejë

Skenari

Një kompani e vogël trajnimi ka një video demonstruese sigurie 7-minutëshe të regjistruar në vitin 2014 në 720p. Përmbajtja ka ende vlerë, por pamjet duken të buta në faqen e re të internetit të kompanisë, veçanërisht në ekranet më të mëdha të laptopëve.

Ekipi dëshiron të eksportojë një version më të pastër 1080p pa rixhiruar. Rreziku është që përmirësimi agresiv i inteligjencës artificiale mund t'i bëjë fytyrat të duken si dylli, ta kthejë tekstin në tabela në "pothuajse fjalë" ose të krijojë teksturë që dridhet nga një kornizë në tjetrën.

Qëllimi nuk është që videoja të duket si e re. Qëllimi është që ajo të bëhet më e qartë, më e qëndrueshme dhe më pak e ngjeshur, duke i mbajtur fytyrën e instruktorit, etiketat paralajmëruese, lëvizjet e duarve dhe detajet e pajisjeve besnike ndaj origjinalit.

Çfarë nevojitet për rrjedhën e punës

Skedar video origjinal, jo një shkarkim i kompresuar nga rrjetet sociale nëse është e mundur

Madhësia e synuar e eksportit, si p.sh. nga 720p në 1080p në vend që të kaloni direkt në 4K

Një përmirësues i shkallëzimit të videos me opsione për heqjen e zhurmës, mprehjen, riparimin e kompresimit dhe qëndrueshmërinë kohore

Një klip i shkurtër testimi me fytyra, lëvizje, tekst dhe sipërfaqe të detajuara

Një listë kontrolli për rishikimin e shkrepjeve, aureolave, tekstit të deformuar, strukturës së fytyrës dhe skajeve lëvizëse

Një kopje e ruajtur e videos origjinale për krahasim dhe zbulim nëse është e nevojshme

Shembull udhëzimi

Përdorni këtë lloj udhëzimi përpara se të përpunoni videon e plotë:

Përmirësojeni këtë video trajnimi 720p në 1080p. Jepini përparësi lëvizjes natyrale, skajeve të qëndrueshme, tekstit ekzistues të lexueshëm dhe strukturës realiste të lëkurës. Përdorni riparim me kompresim të butë dhe mprehtësi të ulët. Mos shpikni tekst që mungon, logo, etiketa, gërvishtje, detaje të fytyrës ose shenja të pajisjeve. Shmangni shkëlqimin nga njëra kornizë në tjetrën. Rezultati përfundimtar duhet të duket më i qartë në madhësinë normale të shikimit, jo artificialisht i mprehtë kur ndalet dhe zmadhohet.

Si ta testoni

Para përpunimit të skedarit të plotë 7-minutësh, eksportoni një mostër 20-sekondëshe që përfshin:

Fytyra e instruktorit ndërsa flet

Një dorë që lëviz nëpër kornizë

Një etiketë paralajmëruese ose tekst i vogël i shtypur

Një sipërfaqe me teksturë, siç është pëlhura, betoni, metali i lëmuar ose plastika

Një panoramë kamere ose çdo lëvizje e lëkundshme

Shikojeni mostrën dy herë: një herë me shpejtësi normale dhe një herë të ndaluar kornizë pas kuadri. Me shpejtësi normale, kërkoni për dridhje, teksturë zvarritëse ose lëvizje të panatyrshme rreth skajeve. Kur të ndaloni, krahasoni versionin origjinal dhe atë të përmirësuar për të kontrolluar nëse teksti, butonat, mjetet dhe tiparet e fytyrës përputhen ende.

Rezultati

Rezultati ilustrues: bazuar në matjen e kohës së një klipi testimi 20-sekondësh dhe më pas zbatimin e të njëjtave cilësime në një video 7-minutëshe.

Një proces pune manual i "ndryshimit të madhësisë dhe mprehjes" zgjati rreth 35 minuta, duke përfshirë eksportimin dhe rishikimin, por rezultati tregoi shkëlqim të dukshëm në flokët e instruktorit dhe aureola rreth shenjave të sigurisë.

Fluksi i punës i ndihmuar nga inteligjenca artificiale zgjati rreth 55 minuta, duke përfshirë eksportimet e testimit, por uli problemet e rishikimit nga 8 probleme të dukshme në eksportimin e parë në 2 probleme të vogla në eksportimin përfundimtar.

Versioni përfundimtar kaloi 10 nga 12 kontrolle në listën e kontrollit të shqyrtimit. Dy problemet e mbetura ishin paksa e butë në tekstin në sfond dhe zhurma e lehtë në një cep të errët. Të dyja u pranuan sepse instruktori, pajisjet dhe hapat e sigurisë mbetën vizualisht të qëndrueshëm.

Metrika kuptimplotë këtu nuk është "arritja e 1080p". Por: sa sekonda të videos shfaqin objekte shpërqendruese gjatë luajtjes normale?

Çfarë mund të shkojë keq

Modeli mund të mprehë blloqet e kompresimit dhe t'i bëjë ato të duken si teksturë e vërtetë.

Teksti i imët mund të duket më i sigurt, por më pak i saktë.

Sipërfaqet mund të bëhen shumë të lëmuara nëse dezhurma është shumë e lartë.

Skajet lëvizëse mund të shkëlqejnë nëse mjeti e trajton secilën kornizë shumë në mënyrë të pavarur.

Një eksportim 4K mund të duket më keq se një eksportim i kufizuar 1080p sepse modeli duhet të shpikë shumë detaje.

Gabimi më i madh është gjykimi vetëm i një kuadri të ndaluar. Përmirësimi i shkallëzimit të videos duhet të duket natyral në lëvizje, jo vetëm mbresëlënës si një imazh statik.

Përgatitje praktike për të marrë me vete

Për videon, përmirësimi i imazhit me anë të inteligjencës artificiale funksionon më mirë kur testoni fillimisht një pjesë të shkurtër, e mbani përmirësimin modest dhe gjykoni lëvizjen përpara mprehtësisë. Një rezultat pak më i butë, por i qëndrueshëm, është zakonisht më i mirë se një version i qartë që dridhet sa herë që dikush lëviz.

Pyetje të shpeshta

Përmirësimi i inteligjencës artificiale dhe si funksionon

Rritja e shkallëzimit me anë të inteligjencës artificiale (shpesh e quajtur "super-rezolucion") rrit rezolucionin e një imazhi duke parashikuar detajet me rezolucion të lartë që mungojnë nga modelet e mësuara gjatë trajnimit. Në vend që thjesht të shtrihen pikselët si interpolimi bikubik, një model studion skajet, teksturat, faqet dhe goditjet e ngjashme me tekstin, pastaj gjeneron të dhëna të reja pikselësh që përputhen me ato modele të mësuara. Është më pak "rivendosja e realitetit" dhe më shumë "bërja e një hamendësimi të besueshëm" që lexohet si i natyrshëm.

Zgjerimi i inteligjencës artificiale kundrejt ndryshimit bikubik ose atij tradicional të madhësisë

Metodat tradicionale të përmirësimit (si metoda bikubike) kryesisht interpolojnë midis pikselëve ekzistues, duke zbutur tranzicionet pa krijuar detaje të reja të vërteta. Përmirësimi i inteligjencës artificiale synon të rindërtojë strukturën e besueshme duke njohur sinjalet vizuale dhe duke parashikuar se si kanë tendencë të duken versionet me rezolucion të lartë të këtyre sinjaleve. Kjo është arsyeja pse rezultatet e inteligjencës artificiale mund të duken shumë më të mprehta, dhe gjithashtu pse ato mund të fusin artefakte ose të "shpikin" detaje që nuk ishin të pranishme në burim.

Pse fytyrat mund të duken si dylli ose tepër të lëmuara

Fytyrat e dyllta zakonisht vijnë nga heqja agresive e zhurmës dhe zbutja e shoqëruar me mprehje që heq strukturën natyrale të lëkurës. Shumë mjete e trajtojnë zhurmën dhe strukturën e imët në mënyrë të ngjashme, kështu që "pastrimi" i një imazhi mund të fshijë poret dhe detajet delikate. Një qasje e zakonshme është të zvogëlohet heqja e zhurmës dhe mprehja, të përdoret një modalitet i ruajtjes së fytyrës nëse është i disponueshëm, dhe më pas të rifutet një prekje e kokrrizave në mënyrë që rezultati të ndihet më pak plastik dhe më fotografik.

Artefakte të zakonshme të përmirësimit të inteligjencës artificiale për t'u vëzhguar

Treguesit tipikë përfshijnë aureola rreth skajeve, modele të përsëritura teksturash (si tulla kopjo-ngjit), mikro-kontrast të fortë dhe tekst që shndërrohet në "pothuajse shkronja". Në rrjedhat e punës të bazuara në difuzion, mund të shihni edhe zhvendosje të detajeve aty ku veçoritë e vogla ndryshojnë lehtë. Për videon, shkëlqimi dhe detajet zvarritëse nëpër kuadro janë flamuj të mëdhenj të kuq. Nëse duket mirë vetëm në zmadhim ekstrem, cilësimet ndoshta janë shumë agresive.

Si ndryshojnë rezultatet GAN, CNN dhe ata që zgjerojnë shkallët e difuzionit

Super-rezolucioni i bazuar në CNN tenton të jetë më i qëndrueshëm dhe më i parashikueshëm, por mund të duket "i përpunuar" nëse shtyhet fort. Opsionet e bazuara në GAN (në stilin ESRGAN) shpesh prodhojnë teksturë dhe mprehtësi më të theksuar, por ato mund të halucinojnë detaje të pasakta, veçanërisht në fytyra. Rritja e shkallëzimit e bazuar në difuzion mund të gjenerojë detaje të bukura dhe të besueshme, megjithatë ato mund të devijojnë nga struktura origjinale nëse cilësimet e udhëzimit ose të forcës janë shumë të forta.

Një strategji praktike cilësimesh për të shmangur një pamje "shumë AI"

Filloni në mënyrë konservative: përmirësoni shkallën 2× ose 4× përpara se të arrini te faktorët ekstremë. Nëse fytyrat duken plastike, pakësoni heqjen e zhurmës dhe mprehjen dhe provoni një modalitet të vetëdijes për fytyrën. Nëse teksturat bëhen shumë intensive, ulni përmirësimin e detajeve dhe merrni në konsideratë shtimin e kokrrizave delikate më pas. Nëse skajet shkëlqejnë, zvogëloni mprehjen dhe kontrolloni shtypjen e aureolës ose artefakteve. Në shumë kanale, "më pak" fiton sepse ruan realizmin e besueshëm.

Trajtimi i skanimeve të vjetra ose imazheve të kompresuara shumë në JPEG para përmirësimit të shkallës

Imazhet e kompresuara janë të ndërlikuara sepse modelet mund t'i trajtojnë artefaktet e bllokut si tekstura të vërteta dhe t'i amplifikojnë ato. Një rrjedhë pune e zakonshme është heqja ose zhbllokimi i artefakteve fillimisht, pastaj rritja e shkallës dhe më pas mprehja e lehtë vetëm nëse është e nevojshme. Për skanimet, pastrimi i butë mund ta ndihmojë modelin të përqendrohet në strukturën aktuale dhe jo në dëmtimin. Qëllimi është të zvogëlohen "sinjalet e rreme të strukturës" në mënyrë që rritësi të mos detyrohet të bëjë hamendësime të sigurta nga të dhënat e zhurmshme.

Pse përmirësimi i videos është më i vështirë se përmirësimi i fotove

Përmirësimi i shkallëzimit të videos duhet të jetë konsistent në të gjitha kuadrot, jo vetëm në një imazh statik. Nëse detajet dridhen nga kuadro në kuadro, rezultati bëhet shpejt shpërqendrues. Qasjet e fokusuara në video përdorin informacion kohor nga kuadrot fqinje për të stabilizuar rindërtimin dhe për të shmangur artefaktet vezulluese. Shumë rrjedha pune përfshijnë gjithashtu heqjen e zhurmës, heqjen e ndërthurjes për burime të caktuara dhe ri-futjen opsionale të kokrrizave në mënyrë që e gjithë sekuenca të ndihet kohezive dhe jo artificialisht e mprehtë.

Kur përmirësimi i inteligjencës artificiale nuk është i përshtatshëm ose është i rrezikshëm për t'u mbështetur në të

Përmirësimi i inteligjencës artificiale trajtohet më së miri si përmirësim, jo si provë. Në kontekste me rrezik të lartë si gazetaria, provat ligjore, imazheria mjekësore ose puna mjeko-ligjore, gjenerimi i pikselëve "të besueshëm" mund të mashtrojë sepse mund të shtojë detaje që nuk janë kapur. Një kornizë më e sigurt është ta përdorni atë në mënyrë ilustruese dhe të zbuloni se një proces i inteligjencës artificiale ka rindërtuar detajet. Nëse besnikëria është kritike, ruani origjinalet dhe dokumentoni çdo hap dhe mjedis përpunimi.

Referencat

arXiv - Mësim i Thellë për Super-rezolucionin e Imazhit: Një Sondazh - arxiv.org
arXiv - Super-Rezolucioni i Imazhit Duke Përdorur Rrjete të Thella Konvolucionale (SRCNN) - arxiv.org
arXiv - Real-ESRGAN - arxiv.org
arXiv - ESRGAN - arxiv.org
arXiv - SR3 - arxiv.org
Zhvilluesi i NVIDIA - NVIDIA DLSS - developer.nvidia.com
AMD GPUOpen - FidelityFX Super Resolution 2 - gpuopen.com
Fondacioni i Vizionit Kompjuterik (CVF) me Qasje të Hapur - BasicVSR: Kërkimi i Komponentëve Thelbësorë në Super-Rezolucionin e Videos (CVPR 2021) - openaccess.thecvf.com
arXiv - Rrjete Gjenerative Kundërshtare - arxiv.org
arXiv - SRGAN - arxiv.org
arXiv - Humbjet Perceptuale (Johnson et al., 2016) - arxiv.org
GitHub - Repo Real-ESRGAN (opsionet e pllakave) - github.com
Wikipedia - Interpolim bikubik - wikipedia.org
Topaz Labs - Foto Topaz - topazlabs.com
Topaz Labs - Video Topaz - topazlabs.com
Qendra e Ndihmës së Adobe - Adobe Enhance > Super Resolution - helpx.adobe.com
NIST / OSAC - Udhëzues Standard për Menaxhimin e Imazheve Dixhitale Forenzike (Versioni 1.0) - nist.gov
SWGDE - Udhëzime për Analizën Forenzike të Imazheve - swgde.org

Gjeni IA-në më të fundit në Dyqanin Zyrtar të Asistentëve të IA-së

Rreth Nesh

Kthehu te blogu

Si funksionon përmirësimi i inteligjencës artificiale: ideja kryesore, me fjalë të përditshme 🧩

Çfarë e bën një version të mirë të përmirësimit të inteligjencës artificiale? ✅🛠️

Tabela Krahasuese: opsionet më të njohura të përmirësimit të inteligjencës artificiale (dhe për çfarë janë të mira) 📊🙂

Sekreti i madh: modelet mësojnë një përputhje nga rezolucioni i ulët në atë të lartë 🧠➡️🖼️

Çështjet kryesore: çfarë ndodh gjatë inferencës (kur përmirësohesh) ⚙️✨

Familjet kryesore të modeleve të përdorura për përmirësimin e inteligjencës artificiale (dhe pse ato duken të ndryshme) 🤖📚

1) Superrezolucion i bazuar në CNN (kari klasik i punës)

2) Përmirësim i bazuar në GAN (stili ESRGAN) 🎭

3) Përmirësim i bazuar në difuzion (karta karakteristike krijuese) 🌫️➡️🖼️

4) Përmirësim i videos me qëndrueshmëri kohore 🎞️

Pse përmirësimi i inteligjencës artificiale ndonjëherë duket i rremë (dhe si ta dalloni) 👀🚩

Si funksionon përmirësimi i inteligjencës artificiale: ana e trajnimit, pa dhimbjen e kokës së matematikës 📉🙂

Flukse pune praktike: foto, skanime të vjetra, anime dhe video 📸🧾🎥

Foto (portrete, peizazhe, pamje të produkteve)

Skanime të vjetra dhe imazhe shumë të kompresuara

Anime dhe art linear

Video

Zgjedhja e cilësimeve pa hamendësuar shumë (një fletë e vogël mashtrimi) 🎛️😵💫

Etika, autenticiteti dhe pyetja e sikletshme e "së vërtetës" 🧭😬

Shënime përmbyllëse dhe një përmbledhje e shpejtë 🧡✅

Shembull nga bota reale: Përmirësimi i fotove të produkteve të vjetra në treg 📸

Skenari

Çfarë nevojitet për rrjedhën e punës

Shembull udhëzimi

Si ta testoni

Rezultati

Çfarë mund të shkojë keq

Përgatitje praktike për të marrë me vete

Shembull nga bota reale: Përmirësimi i një videoje të vjetër stërvitore pa e bërë atë të shkëlqejë

Skenari

Çfarë nevojitet për rrjedhën e punës

Shembull udhëzimi

Si ta testoni

Rezultati

Çfarë mund të shkojë keq

Përgatitje praktike për të marrë me vete

Pyetje të shpeshta

Përmirësimi i inteligjencës artificiale dhe si funksionon

Zgjerimi i inteligjencës artificiale kundrejt ndryshimit bikubik ose atij tradicional të madhësisë

Pse fytyrat mund të duken si dylli ose tepër të lëmuara

Artefakte të zakonshme të përmirësimit të inteligjencës artificiale për t'u vëzhguar

Si ndryshojnë rezultatet GAN, CNN dhe ata që zgjerojnë shkallët e difuzionit

Një strategji praktike cilësimesh për të shmangur një pamje "shumë AI"

Trajtimi i skanimeve të vjetra ose imazheve të kompresuara shumë në JPEG para përmirësimit të shkallës

Pse përmirësimi i videos është më i vështirë se përmirësimi i fotove

Kur përmirësimi i inteligjencës artificiale nuk është i përshtatshëm ose është i rrezikshëm për t'u mbështetur në të

Referencat

Gjeni IA-në më të fundit në Dyqanin Zyrtar të Asistentëve të IA-së

Rreth Nesh

Pyetje të shpeshta shtesë

Si ndryshon përmirësimi i madhësisë me anë të inteligjencës artificiale nga metodat tradicionale të ndryshimit të madhësisë?

Cilat janë defektet e zakonshme që duhet të kem parasysh kur përdor përmirësimin e inteligjencës artificiale?

Pse fytyrat ndonjëherë duken shumë të lëmuara ose joreale pas përmirësimit të shkallës?

Çfarë duhet të bëj nëse imazhet e mia duken të ashpra ose kanë zhurmë të tepërt pas përdorimit të përmirësimit të shkallës me anë të inteligjencës artificiale?

Si krahasohen modelet GAN dhe CNN në rezultatet e përmirësimit të inteligjencës artificiale?

A është përmirësimi i inteligjencës artificiale i përshtatshëm për përmbajtjen video dhe çfarë sfidash paraqet?

Kur nuk është e përshtatshme të mbështetemi në përmirësimin e inteligjencës artificiale?

Çfarë konsideratash duhet të kem parasysh kur përmirësoj imazhet e kompresuara shumë?