Kaj je optično prepoznavanje znakov (OCR)?

Optično prepoznavanje znakov (OCR) se nanaša na programsko opremo, ki ustvarja digitalno različico natisnjenega, vnašanega ali ročno napisanega dokumenta, ki ga lahko računalniki preberejo, ne da bi bilo treba ročno vnašati besedilo ali ga vnesti. OCR se običajno uporablja za skenirane dokumente v obliki PDF , lahko pa tudi ustvari računalniško berljivo različico besedila v slikovni datoteki.

Kaj je OCR?

OCR, imenovan tudi prepoznavanje besedila, je programska tehnologija, ki znake, kot so številke, črke in ločila (tudi imenovane glyphs), pretvorijo iz tiskanih ali pisnih dokumentov v elektronsko obliko, ki jo lažje prepoznajo in brskajo računalniki in drugi programi. Nekateri programi OCR to počnejo, ko je dokument skeniran ali fotografiran z digitalnim fotoaparatom, drugi pa lahko ta postopek uporabijo za dokumente, ki so bili prej optično prebrani ali fotografirani brez OCR-ja. OCR omogoča uporabnikom, da iščejo v dokumentih PDF, urejate besedilo in znova oblikujejo dokumente.

Za kaj se uporablja OCR?

Za hitre, vsakodnevne potrebe po skeniranju, OCR morda ni velika stvar. Če naredite veliko skeniranja, lahko poiščete natančno tistega, ki ga potrebujete, lahko shranite precej časa in naredite OCR funkcionalnost v programu optičnega bralnika pomembnejši. Tukaj je nekaj drugih stvari OCR pomaga pri:

Zakaj uporabljati OCR?

Zakaj ne bi vzeli slike, kajne? Ker ne bi mogli ničesar urejati ali iskati besedila, ker bi bil le slika. Skeniranje dokumenta in zagonske programske opreme OCR lahko to datoteko pretvori v nekaj, kar lahko urejate in lahko iščete.

Zgodovina OCR

Čeprav je bila najzgodnejša uporaba besedila priznana leta 1914, se je široko razširjen razvoj in uporaba tehnologij, povezanih z OCR, začel že v petdesetih letih, še posebej z oblikovanjem zelo poenostavljenih pisav, ki so jih lažje pretvorili v digitalno berljivo besedilo. Prvi od teh poenostavljenih pisav je ustvaril David Shepard in splošno znano kot OCR-7B. OCR-7B se še vedno uporablja v finančni industriji za standardno pisavo, ki se uporablja za kreditne kartice in debetne kartice. V šestdesetih letih so poštne storitve v več državah začele uporabljati tehnologijo OCR, ki je močno pospešila razvrščanje po pošti, vključno z Združenimi državami, Veliko Britanijo, Kanado in Nemčijo. OCR je še vedno osnovna tehnologija za razvrstitev pošte za poštne storitve po vsem svetu. Leta 2000 je bilo ključno znanje o mejah in zmožnostih tehnologije OCR uporabljeno za razvoj programov CAPTCHA, ki so bili uporabljeni za zaustavitev pošiljk britev in pošiljateljev neželene elektronske pošte.

V desetletjih je OCR postal bolj natančen in bolj sofisticiran zaradi napredka na sorodnih tehnoloških področjih, kot so umetna inteligenca , strojno učenje in računalniški vid. Danes programska oprema OCR uporablja prepoznavanje vzorcev, zaznavanje funkcij in rudarjenje besedila za hitrejše in natančnejše pretvorbo dokumentov kot kdajkoli prej.