Pagrindiniai pasiėmimai
- Naujas dirbtinio intelekto įrankis gali padėti istorikams iššifruoti senovinius tekstus.
- Ithaca yra pirmasis gilusis neuroninis tinklas, galintis atkurti trūkstamą pažeistų užrašų tekstą, nustatyti jų pradinę vietą ir padėti nustatyti jų sukūrimo datą.
- AI naudinga užpildyti trūkstamus duomenis, pvz., teksto vietą ir datą, nes ji padeda išmokti labai sudėtingus modelius analizuojant duomenis.
Naujausi dirbtinio intelekto (AI) pažanga skatina pastangas suprasti praeitį.
„Ithaca“, mašininio mokymosi modelis, kurį sukūrė „DeepMind“dirbtinio intelekto tyrėjai, gali atspėti trūkstamus žodžius ir rašytinės kalbos vietą bei datą, teigiama naujame dokumente. Pastangos galėtų padėti istorikams iššifruoti senovinius rankraščius.
„Itaka yra gilus neuroninis tinklas, todėl jis neįtikėtinai gali aptikti paslėptus šablonus didžiuliame duomenų kiekyje“, – „Lifewire“el. interviu. „Tokie modeliai gali būti tekstiniai (gramatinės, sintaksės arba susieti su pasikartojančia „formule“daugelyje tekstų) arba kontekstiniai (tam tikri žodžiai, nuosekliai atsirandantys tam tikrų žanrų tekstuose: pvz., klasikinio Atėnų politinis dekretas, kuriame minimi žodžiai „sąjunga, taryba, asamblėja…').“
Praeities atskleidimas
Ithaca yra pirmasis gilusis neuroninis tinklas, galintis atkurti trūkstamą pažeistų užrašų tekstą, nustatyti jų pradinę vietą ir padėti nustatyti jų sukūrimo datą, sakė Sommerschieldas.
Itaka pavadinta Graikijos salos vardu Homero Odisėjoje. Tyrėjai nustatė, kad Ithaca pasiekia 62 % tikslumą atkurdama pažeistus tekstus, 71 % tikslumą nustatydama jų pradinę vietą ir gali nustatyti tekstus 30 metų nuo jų atsiradimo datos.
Ithaca vizualizavimo priemonės skirtos padėti tyrėjams lengviau interpretuoti rezultatus. Straipsnio autoriai rašė, kad istorikai pasiekė 25% tikslumą, kai vieni dirbo atkurti senovės tekstus. Tačiau naudojant Ithaca istoriko našumas padidėja iki 72 %, pranoksta modelio našumą ir parodo žmogaus ir mašinos bendradarbiavimo potencialą.
„Ithaca“siūlo interpretuojamus rezultatus, parodančius didėjančią žmonių ekspertų bendradarbiavimo ir mašininio mokymosi svarbą, ir parodo, kaip žmonių ekspertų suderinimas su gilaus mokymosi architektūra, kad jie galėtų bendradarbiauti užduotis, gali pranokti tiek žmonių, tiek žmonių individualius (be pagalbos) rezultatus. modelis atlieka tas pačias užduotis “, - „Lifewire“pasakojo Sommerschieldas.
Pavyzdžiui, istorikai šiuo metu nesutaria dėl daugelio svarbių Atėnų dekretų, priimtų tuo metu, kai gyveno tokie žymūs veikėjai kaip Sokratas ir Periklis, datos, dienoraščio įraše rašė Sommerschieldas. Ilgą laiką buvo manoma, kad potvarkiai buvo parašyti anksčiau nei 446/445 m. pr. Kr., nors nauji įrodymai rodo, kad data yra 420 m. „Nors tai gali atrodyti nedidelis skirtumas, šie dekretai yra esminiai mūsų supratimui apie klasikinių Atėnų politinę istoriją“, – rašė ji
Arčiausiai Ithaca esantis darbas yra ankstesnis mašininio mokymosi įrankis, vadinamas Pythia, kurį Sommerschield ir jos bendradarbiai išleido 2019 m. Pythia buvo pirmasis senovinis teksto atkūrimo modelis, kuriame buvo naudojami gilieji neuroniniai tinklai.
„Šiandien Ithaca yra pirmasis modelis, kuris visapusiškai sprendžia tris pagrindines epigrafo darbo eigos užduotis“, – elektroniniame laiške sakė Sommerschieldas. „Tai ne tik patobulina ankstesnį Pythia sukurtą naujausią techniką, bet ir pirmą kartą precedento neturinčiu mastu naudoja gilų mokymąsi geografiniam ir chronologiniam priskyrimui."
AI padėti istorikams
AI yra naudinga užpildant trūkstamus duomenis, pvz., teksto vietą ir datą, nes jis gerai išmoksta labai sudėtingus modelius analizuojant duomenis, „Lifewire“el. paštu sakė AI bendrovės „Singulos Research“generalinis direktorius Bradas Quintonas.
„Naudodamas mašininio mokymosi metodus, AI gali peržiūrėti daugybę „žinomų gerų“pavyzdžių, kad surastų modelius tarp, pavyzdžiui, nurodyto teksto ir jo sukūrimo datos bei vietos“, – pridūrė Quintonas. „Dažnai šie modeliai yra tokie sudėtingi, kad žmonių ekspertui jie nebūtų akivaizdūs.“
Trūkstamų duomenų numatymas yra įprasta mašininiu mokymusi pagrįsto AI užduotis. Pavyzdžiui, GPT-3 iš OpenAI gali numatyti trūkstamus žodžius sakinyje arba net trūkstamus sakinius pastraipoje. Be to, daugelis dirbtiniu intelektu pagrįstų vaizdo apdorojimo sistemų buvo naudojamos atkurti vaizdo įrašus ir vaizdus išmaniai nuspėjant, kas buvo prarasta iš originalo.
„Konceptualiai tyrėjai galėtų naudoti panašius metodus, kad nustatytų meno ar įrankių arba kitų istorinių žmogaus sukurtų artefaktų datą ir kilmę, kai tikimasi, kad pagrindinis stilius ir technika laikui bėgant ir pagal vietą kilmės“, – sakė Kvintonas.