Šis AI neatpažįstamas pikselių nuotraukas paverčia kristališkai skaidriais vaizdais

Ši dirbtinio intelekto technologija paverčia „Enhance“! Televizijos tropa į realybę.

Šis AI neatpažįstamas pikselių nuotraukas paverčia kristališkai skaidriais vaizdais

Prisiminkite visus tuos laikus, kai šyptelėjote, kai koks televizijos veikėjas priartino nuotrauką ir pasakė „Patobulinti“! paversti neryškią netvarką į labai išsamų, skustuvo aštrų vaizdą? Dabar yra sistema-dirbtinio intelekto varoma vaizdo didinimo programa EnhanceNet - dėl to bus neįmanoma juoktis iš šios kino juostos, nes dabar tai yra technologinė realybė.



Antraštė: kairėje - originalus vaizdas. Mokslininkai maitino pikseliuotą paukštį (centre) į „EnhanceNet“. Rezultatas dešinėje atrodo beveik nesiskiriantis nuo originalo. [Šaltinio vaizdai: Mehdi S. M. Sajjadi, Bernhard Schölkopf, Michael Hirsch]

Tiesiog pažvelkite į aukščiau esančius vaizdus. Jie nėra netikri. „EnhanceNet“ gali padaryti labai pikseliuotą, mažos skiriamosios gebos paukščio nuotrauką ir paversti ją krištolo skaidrumo vaizdu. Jis netgi atkuria fotoaparato lauko gylį iš originalios nuotraukos, kaip matote priekinio plano medžių šakose.



Jos išradėjai-Mehdi S. M. Sajjadi, Bernhardas Schölkopfas ir Michaelas Hirschas iš Max-Planck intelektualių sistemų instituto Vokietijoje-klasifikuoja savo programinę įrangą kaip vieno vaizdo super rezoliuciją automatizuotos tekstūros sintezės būdu. Būtent tai ir daro: jis padidina labai mažos skiriamosios gebos nuotraukas, sintezuodamas tekstūras, kurios į gautą didelės skiriamosios gebos vaizdą įneša naujų detalių. Dėl sintetinių detalių gautos nuotraukos yra tokios tikroviškos, kad jos beveik nesiskiria nuo tikrųjų nuotraukų. Galbūt pirmą kartą dirbtinis intelektas dabar gali atkurti realybę neįtikėtinai tiksliai-naudodami netikras detales.



[Šaltinio vaizdai: Mehdi S. M. Sajjadi, Bernhard Schölkopf, Michael Hirsch]

Remiantis daugybe tyrėjų aprašytų eksperimentų popieriaus , rezultatas žymiai padidina vaizdo kokybę esant dideliam didinimo koeficientui. Programinė įranga sukuria šiuos vaizdus, ​​perduodama visiškai konvoliucinius neuroninius tinklus varžybų metu. Kitaip tariant, kaip ir kiti priešiniai neuroniniai tinklai, viena sistema generuoja rezultatus, o kita vertina rezultato tikslumą.

Dėl šios technologijos gėda dabartiniai aukščiausios klasės nuotraukų mastelio keitimo metodai. Šiame palyginime galite pamatyti didžiulį skirtumą tarp aukščiausio lygio metodo (PSNR arba maksimalaus signalo ir triukšmo santykio) kairėje ir „EnhanceNet“ gauto rezultato dešinėje:

angelo numeriai 666



[Vaizdas: Mehdi S. M. Sajjadi, Bernhard Schölkopf, Michael Hirsch]

Pirmasis sakalas yra panašus į „Photoshop“ mastelio keitimą, dėl kurio visada gaunami pernelyg išlyginti vaizdai, kurie neišvengiamai praranda apibrėžimą ir neatitinka žmogaus akių testo. „EnhanceNet“ rezultato kokybės ir detalumo padidėjimas yra akivaizdus.

Kalbėdamas elektroniniu paštu, Mehdi S. M. Sajjadi tvirtina, kad algoritmą galima lengvai įdėti į komercinę programinę įrangą, tokią kaip „Photoshop“. Dar įdomiau yra tai, kad jūs iš tikrųjų galėtumėte tai padaryti išmaniųjų telefonų operacinės sistemos dalimi, pagerindami vaizdų kokybę, kai priartinate juos, kad išvengtumėte neryškumo realiuoju laiku, sako Sajjadi. Tam yra papildomų programų, priduria jis:

Nuo senų filmų atrankos iki 4K kokybės, senų šeimos nuotraukų, kurios yra pernelyg neryškios, kai norite gauti didelį spausdinimą, atkūrimo į bendresnes programas, pvz., Pagerinti objektų aptikimą. Tai mes iš tikrųjų studijavome laikraštyje. Pasirodo, naudojant mūsų algoritmą vaizdams, kiti neuroniniai tinklai lengviau aptinka vaizdų objektus, kurie turi platų pritaikymą nuo „Google“ vaizdų paieškos iki pėsčiųjų aptikimo savarankiškai važiuojančiuose automobiliuose.

44 angelo skaičiaus reikšmė



Įsivaizduokite: vienas neuronų tinklas pagerina vaizdą, o kitas naudoja rezultatą objektams aptikti. Žinoma, tai taip pat gali apimti teisėsaugos programas. Sajjadi man sakė, kad net jei rekonstruotos detalės nebūtinai yra tikrosios [. . .] metodai iš tiesų gali būti naudojami ypatingais atvejais, pvz., valstybinio numerio atpažinimas. Tai reiškia, kad policijai nereikės laukti, kol itin didelės skiriamosios gebos kameros užfiksuos žmones, viršijančius greitį. Jie galėtų naudoti šią technologiją tai padaryti dabar.

[Šaltinio vaizdai: Mehdi S. M. Sajjadi, Bernhard Schölkopf, Michael Hirsch]

[Šaltinio vaizdai: Mehdi S. M. Sajjadi, Bernhard Schölkopf, Michael Hirsch]

Jūs taip pat galėtumėte naudoti šią sistemą, sako Sajjadi, kad pašalintumėte pikseliuotus veidus, pvz., Anoniminėse nuotraukose. Ir nors rekonstruotas veidas nebūtinai yra identiškas pradiniam, nes dauguma informacijos buvo prarasta pikseliavimo proceso metu [. . .] tai gali padėti identifikuoti ką nors. Jis sako, kad tai nebūtų įrodymas teisme, tačiau jūs galite atpažinti žmones, kurių anksčiau negalėjote atpažinti.

Ši technologija gali kelti realią grėsmę privatumui. Kažkas galėtų gauti tam kodą ir išmokyti neuroninį tinklą, kad jis iš naujo sukurtų vaizdą, kuris anksčiau buvo neryškus ar pikseliuotas. Jei kada nors įkėlėte mėgėjišką pornografiją su pikselių veidais, pasiruoškite būti demaskuotiems.