Kas yra optinis simbolių atpažinimas (OCR)?

Turinys:

Kas yra optinis simbolių atpažinimas (OCR)?
Kas yra optinis simbolių atpažinimas (OCR)?
Anonim

Optinis simbolių atpažinimas (OCR) reiškia programinę įrangą, kuri sukuria skaitmeninę spausdinto, atspausdinto arba ranka rašyto dokumento versiją, kurią kompiuteriai gali perskaityti nereikalaujant rankiniu būdu įvesti ar įvesti teksto. OCR paprastai naudojamas nuskaitytiems dokumentams PDF formatu, bet taip pat gali sukurti kompiuterio skaitomą teksto versiją vaizdo faile.

Kas yra OCR

OCR, dar vadinamas teksto atpažinimu, yra programinės įrangos technologija, kuri paverčia simbolius, tokius kaip skaičiai, raidės ir skyrybos ženklai (taip pat vadinami glifais) iš spausdintų ar rašytinių dokumentų į elektroninę formą, kurią lengviau atpažinti ir skaityti kompiuteriais ir kitos programinės įrangos programos. Kai kurios OCR programos tai daro, nes dokumentas nuskaitomas arba nufotografuojamas skaitmeniniu fotoaparatu, o kitos gali taikyti šį procesą dokumentams, kurie anksčiau buvo nuskaityti arba nufotografuoti be OCR. OCR leidžia vartotojams ieškoti PDF dokumentuose, redaguoti tekstą ir iš naujo formatuoti dokumentus.

Image
Image
Istorinio laikraščio nuskaitymas naudojant OCR programinę įrangą.

Getty Images

Kam naudojamas OCR?

Jei reikia greito, kasdieninio nuskaitymo, OCR gali būti nereikšminga. Jei nuskaitote daug, galėdami ieškoti PDF rinkmenose, kad surastumėte būtent tai, ko jums reikia, galite sutaupyti nemažai laiko, o OCR funkcija jūsų skaitytuvo programoje tampa svarbesnė. Štai keletas kitų dalykų, kurie padeda OCR:

  • Automatinis duomenų apdorojimas ir duomenų įvedimas (Pavyzdys: kandidatų į darbą sekimo sistemos gyvenimo aprašymams).
  • Padaryti nuskaitytų knygų paieškas.
  • Ranka rašytų nuskaitymų konvertavimas į kompiuteriu skaitomą tekstą.
  • Padaryti, kad dokumentai būtų lengviau naudojami skaitymo programoms, kurios padeda silpnaregiams naudotojams.
  • Istorinių dokumentų ir laikraščių išsaugojimas, kartu užtikrinant jų paiešką.
  • Duomenų ištraukimas ir perkėlimas į apskaitos programas (pavyzdys: kvitai ir sąskaitos faktūros).
  • Indeksuoti dokumentus, skirtus naudoti paieškos sistemoms.
  • Vairuotojo valstybinių numerių atpažinimas naudojant greičio matuoklį ir raudonos šviesos kameros programinę įrangą.
  • Kalbos sintezatoriai nemokantiems kalbėti – teorinis fizikas Stephenas Hawkingas yra bene žinomiausias kalbos sintezatoriaus programos vartotojas.

Bottom Line

Kodėl tiesiog nenufotografavus, tiesa? Nes negalėtumėte nieko redaguoti ar ieškoti teksto, nes tai būtų tik vaizdas. Nuskaitę dokumentą ir paleidę OCR programinę įrangą, tą failą galite redaguoti ir galėsite ieškoti.

OCR istorija

Nors pats ankstyviausias teksto atpažinimo naudojimas datuojamas 1914 m., plačiai paplitęs su OCR susijusių technologijų plėtojimas ir naudojimas rimtai prasidėjo šeštajame dešimtmetyje, ypač sukūrus labai supaprastintus šriftus, kuriuos buvo lengviau konvertuoti į skaitmeninį. skaitomas tekstas. Pirmąjį iš šių supaprastintų šriftų sukūrė Davidas Shepardas ir paprastai žinomas kaip OCR-7B. OCR-7B ir šiandien vis dar naudojamas finansų pramonėje standartiniam šriftui, naudojamam kredito kortelėse ir debeto kortelėse. Šeštajame dešimtmetyje pašto tarnybos keliose šalyse pradėjo naudoti OCR technologiją, kad labai paspartintų laiškų rūšiavimą, įskaitant JAV, Didžiąją Britaniją, Kanadą ir Vokietiją. OCR vis dar yra pagrindinė technologija, naudojama pašto paslaugų rūšiavimui visame pasaulyje. 2000 m. pagrindinės žinios apie OCR technologijos ribas ir galimybes buvo panaudotos kuriant CAPTCHA programas, naudojamas robotams ir šiukšlių siuntėjams sustabdyti.

Bėgant dešimtmečiams OCR tapo tikslesnis ir sudėtingesnis dėl pažangos susijusiose technologijų srityse, pvz., dirbtinio intelekto, mašininio mokymosi ir kompiuterinio regėjimo. Šiandien OCR programinė įranga naudoja šablonų atpažinimą, funkcijų aptikimą ir teksto gavybą, kad dokumentai transformuotųsi greičiau ir tiksliau nei bet kada anksčiau.

DUK

    Kaip nuskaityti dokumentus telefonu arba planšetiniu kompiuteriu?

    Jei naudojate „iOS“, atidarykite programą „Notes“ir sukurkite naują užrašą. Atidarykite fotoaparatą, tada bakstelėkite Scan Documents. Jei naudojate „Android“, atidarykite „Google“diską ir pasirinkite Plus (+), tada palieskite Scan, kad nuskaitytumėte dokumentą su telefonu.

    Kaip naudoti OCR programoje Adobe Acrobat?

    Atidarykite PDF failą su nuskaitytu vaizdu, tada pasirinkite Tools > Redaguoti PDF. Acrobat automatiškai pritaikys OCR, kad galėtumėte redaguoti tekstą. Tiesiog pasirinkite, kur norite redaguoti, ir pradėkite rašyti.

    Kuo skiriasi OCR ir OMR?

    Optinis žymų atpažinimas (OMR) yra programinė įranga, aptinkanti žymes ant popieriaus, paprastai burbulo lapo. OMR naudojamas apdorojant egzaminų, apklausų, anketų ir net rinkimų rezultatus. Kitaip nei OCR, OMR negali iššifruoti žymių puslapyje, o tik patikrina, ar žymės yra.

Rekomenduojamas: