Ką žinoti
- Google Books Ngram Viewer įveskite frazę, pasirinkite dienų seką ir korpusą, nustatykite išlyginimo lygį ir spustelėkite Ieškoti daug knygų.
- Galite įsigilinti į duomenis. Pavyzdžiui, norėdami ieškoti veiksmažodžio formos žuvis, o ne daiktavardžio žuvis, naudokite žymą: search for fish_VERB.
- Ngram Viewer išveda grafiką, vaizduojantį frazės naudojimą laikui bėgant. Kelių frazių atveju kiekviena žymima spalvine linija.
Šiame straipsnyje paaiškinama, kaip naudoti „Ngram Viewer“įrankį „Google“knygose atliekant tyrimus ir paieškas.
Kaip veikia „Ngram Viewer“
Ngrama, dar vadinama N-grama, yra statistinė teksto ar kalbos turinio analizė, siekiant rasti n (skaičius) tam tikro teksto elemento.
Paieškos elementas gali būti įvairus, įskaitant fonemas, priešdėlius, frazes ir raides. Nors Ngrama yra neaiški už mokslinių tyrimų bendruomenės ribų, ji naudojama įvairiose srityse ir turi daug reikšmės kūrėjams, kurie koduoja kompiuterines programas, kurios supranta ir reaguoja į natūralią šnekamąją kalbą.
„Google Books Ngram Viewer“atveju tekstas, kurį reikia analizuoti, gaunamas iš daugybės viešajame domene esančių knygų, kurias „Google“nuskaito, kad užpildytų savo „Google“knygų paieškos variklį. „Google Books Ngram Viewer“teksto, kurio ieškote, turinį „Google“vadina korpusu. „Ngram Viewer“kaupia pagal kalbą, nors galite atskirai analizuoti britų ir amerikiečių anglų kalbas arba jas sujungti.
- Eikite į „Google“knygų Ngramų peržiūros priemonę adresu books.google.com/ngrams.
-
Įveskite bet kurią frazę ar frazes, kurias norite analizuoti. Kiekvieną frazę atskirkite kableliu. „Google“siūlo „Albertas Einšteinas, Šerlokas Holmsas, Frankenšteinas“, kad galėtumėte pradėti.
Atliekant paiešką naudojant „NGram Viewer“, elementuose skiriamos didžiosios ir mažosios raidės, skirtingai nei „Google“žiniatinklio paieškose.
- Pasirinkite dienų seką. Numatytoji vertė yra nuo 1800 iki 2000.
- Pasirinkite korpusą. Galite ieškoti užsienio kalbų tekstų arba tekstų anglų kalba, o be standartinių pasirinkimų sąrašo apačioje galite pastebėti tokius įrašus kaip „Anglų (2009)“arba „Amerikos anglų kalba (2009)“. Tai yra senesni korpusai, kuriuos „Google“nuo tada atnaujino, bet galbūt turite kokių nors priežasčių palyginti su senais duomenų rinkiniais. Daugelis vartotojų gali jų nepaisyti ir sutelkti dėmesį į naujausius korpusus.
-
Nustatykite išlyginimo lygį. Išlyginimas reiškia, koks sklandus grafikas yra pabaigoje. Tiksliausias vaizdas atspindi 0 išlyginimo lygį, tačiau šį nustatymą gali būti sunku perskaityti. Numatytasis nustatymas yra 3. Daugeliu atvejų jums jo koreguoti nereikia.
- Paspauskite Ieškokite daugybės knygų.
Naudodami „Google“Ngram Viewer galite įsigilinti į duomenis. Jei norite ieškoti veiksmažodžio žuvis, o ne daiktavardžio žuvis, tai galite padaryti naudodami žymas. Šiuo atveju turėtumėte ieškoti fish_VERB.
„Google“savo svetainėje pateikia visą komandų sąrašą, kitą išplėstinę dokumentaciją, skirtą naudoti su „Ngram Viewer“.
Bottom line
Google Books Ngram Viewer išveda grafiką, vaizduojantį tam tikros frazės vartojimą knygose laikui bėgant. Jei įvedėte daugiau nei vieną žodį ar frazę, kiekvienas iš jų bus pavaizduotas spalvine linija, kad būtų kontrastas su kitais paieškos terminais. Tai panašu į „Google Trends“, tik paieška apima ilgesnį laikotarpį.
Atvejo analizė
Apsvarstykite acto pyragų atvejo tyrimą. Jie minimi Laura Ingalls Wilder seriale Little House on the Prairie. Naršydami naudodami „Google“žiniatinklio paiešką, norėdami sužinoti daugiau apie acto pyragus, paaiškėja, kad jie laikomi Amerikos pietų virtuvės dalimi ir iš tikrųjų gaminami su actu. Jie prisimena laikus, kai ne visi galėjo gauti šviežių produktų visais metų laikais, bet ar tai visa istorija?
Ieškokite „Google Ngram Viewer“acto pyrago ir pamatysite kai kuriuos pyrago paminėjimus tiek XX a. pradžioje, tiek pabaigoje, daug paminėjimų XX a. ketvirtajame dešimtmetyje ir vis daugiau paminėjimų pastaruoju metu. Tačiau, kai išlyginimo lygis yra 3, matote plynaukštę virš minėjimų 1800-aisiais. Kadangi per tą laiką knygų nebuvo išleista daug, o duomenys nustatyti sklandžiai, vaizdas iškraipomas. Tikriausiai tik vienoje knygoje buvo paminėtas acto pyragas, ir jis buvo apskaičiuotas vidutiniškai, kad būtų išvengta smaigalio. Nustačius išlyginimą į 0, pamatysite, kad būtent taip ir yra. Smailės centras yra 1869 m., o dar vienas smaigalys yra 1897 ir 1900 m.
Mažai tikėtina, kad likusį laiką niekas nekalbėjo apie acto pyragus: tikriausiai visur sklandė receptai, bet žmonės apie juos nerašė knygose, ir tai yra svarbus Ngram paieškų apribojimas.