Pagrindiniai pasiėmimai
- DALL·E yra naujas neuroninis tinklas, galintis piešti vaizdus pagal tekstą.
- Tinklas yra vienas iš augančių dirbtinio intelekto projektų, galinčių imituoti žmonių kūrybinius rezultatus, skaičiaus.
- Ekspertai sako, kad dirbtinio intelekto piešti vaizdai nėra originalūs kūriniai.
Perkelk, Pikaso. Naujas neuroninis tinklas gali piešti vaizdus pagal tekstą.
DALL·E, menininko Salvadoro Dalí ir Pixar's WALL·E vardų vaizdelis, gali paimti bet kokį tekstą ir sukurti iš jo vaizdą. Sistema naudoja neuroninį tinklą, kuris buvo išmokytas naudoti milijardus paveikslėlių ir teksto pavyzdžių. Tai vienas iš augančio AI projektų skaičiaus, kuris gali imituoti, bet ne atkartoti žmonių kūrybinius rezultatus.
„Kadangi natūrali kalba nuolat vystosi ir labai priklauso nuo konteksto niuansų, mašinos išmokymas suprasti kalbą pakankamai gerai, kad būtų galima nupiešti paveikslėlį, yra labai reikšmingas pasiekimas“, – sakė Tamara Schwartz, Pensilvanijos Jorko koledžo kibernetinio saugumo profesorė., sakė interviu el. „Įsivaizduokite policijos eskizų menininką, kuris yra retas talentas, galintis sukurti paveikslą pagal liudininko aprašymą“.
Didelių duomenų naudojimas vaizdams kurti
DALL-E sukūrė dirbtinio intelekto tyrimų bendrovė OpenAI ir ji kaupia daugybę duomenų iš interneto. Tada duomenys apdorojami natūralios kalbos modeliu ir mokomi kurti vaizdus iš teksto. DALL-E veikia panašiai kaip neseniai išleistas GPT-3 – OpenAI sukurtas kalbos modelis, kuris gali būti paragintas generuoti originalias teksto dalis. GPT-3 buvo išmokytas naudojant pusę trilijono žodžių interneto teksto ir gali sukurti stebėtinai tikrovišką tekstą.
Išmokyti mašiną pakankamai gerai suprasti kalbą, kad būtų galima nupiešti paveikslėlį, yra labai svarbus pasiekimas.
Michaelas Yurushkinas, duomenų mokslo įmonės BroutonLab įkūrėjas ir CTO, elektroniniame interviu sakė, kad DALL-E yra „vienas iš nedaugelio sėkmingų žmonijos pastangų imituoti mūsų kūrybiškumą ir vaizduotę“. Jis pridūrė: „Lengviau suvokti, kaip dirbtinis intelektas ką nors nuspėja, peržiūrint atitinkamus duomenis, bet suprasti, kaip jis gali sukurti piešinius iš dalykų, apie kuriuos anksčiau „niekad negirdėjo“, yra sunkiau“.
Schwartz atkreipia dėmesį į tai, kad dirbtinis intelektas nekuria informacijos, o paima kalbos duomenis ir paverčia juos vaizdais.
"Pradinis kūrybiškumas kyla iš žmogaus, kuris sukūrė užduotį", - sakė Schwartzas. AI yra šiek tiek „kūrybiškumo“, nes jis eksperimentuoja su įvairiais duomenų deriniais ir tada pasirenka iš daugelio galimų rezultatų. Tačiau žmogus tiria rezultatus ir moko dirbtinį intelektą, kaip pasirinkti iš daugelio derinių."
Roboto detektyvo darbas?
Mašina gali eksperimentuoti su šiais duomenų ir objektų deriniais daug greičiau nei žmogus menininkas. Schwartzas pažymėjo, kad DALL-E vieną dieną galėtų bendradarbiauti su detektyvu, bandančiu atstatyti nusik altimo vietą pagal eskizą, remiantis liudininkų parodymais.
„Kadangi liudininkai pateikia savo parodymus, kompiuteris gali paimti tą šnekamą, natūralia kalba informaciją ir sukurti scenos piešinį arba daugybę scenos piešinių“, – sakė ji. "Tada šias vizualizacijas būtų galima integruoti, kad būtų sukurtas tikslesnis prarastų įrodymų vaizdas. Ši vizualizacija galėtų būti praturtinta integruojant ankstesnius vietos vaizdus prieš nusik altimą."
Kelios kitos AI valdomos programos gali sukurti meno kūrinius. Pavyzdžiui, „Ai-Da“meno kūrimui naudoja robotų rankų sistemą ir veido atpažinimo technologiją, suporuotą su dirbtiniu intelektu. Sistema gali išanalizuoti vaizdą, patalpintą priešais aparatą, kuris įtraukiamas į algoritmą, sukuriantį roboto rankos judesius.
Tačiau žmonės menininkai neturėtų jaudintis, kad juos pakeis robotų valdovai, praėjusiais metais „The New York Times“teigė Rutgerso universiteto Meno ir dirbtinio intelekto laboratorijos direktorius Ahmedas Elgammalas.
„Nors meno apibrėžimas nuolat kinta, jo esmė yra žmonių bendravimo forma“, – rašė jis. "Jei už mašinos nėra žmogaus menininko, dirbtinis intelektas gali padaryti tik žaisti su forma, nesvarbu, ar tai reiškia manipuliuoti pikseliais ekrane, ar užrašais muzikinėje knygoje. Ši veikla gali būti įtraukianti ir intriguojanti, tačiau be sąveikos ji neturi prasmės. atlikėjas ir publika."
Pažiūrėjęs į DALL-E darbus, suprantu Elgammalo mintį, kad dirbtinio intelekto sukurti vaizdai nėra menas. Kita vertus, jie geresni už bet kokį meną, kurį galėčiau sukurti. Taigi, iš tikrųjų, koks skirtumas?