Optiese karakterherkenning

Optiese karakterherkenning of optiese karakterlesing is die elektroniese of meganiese omskakeling van beelde van getikte, handgeskrewe of gedrukte teks in masjiengekodeerde teks, hetsy van 'n geskandeerde dokument, 'n foto van 'n dokument, 'n toneelfoto (byvoorbeeld die teks op tekens en advertensieborde in 'n landskapfoto) of van ondertitelteks wat op 'n beeld geplaas is (byvoorbeeld van 'n televisieuitsending).[1]

Optiese karakterherkenning word wyd gebruik as 'n vorm van data-invoer vanaf gedrukte papierdatarekords – hetsy paspoortdokumente, fakture, bankstate, gerekenariseerde kwitansies, besigheidskaartjies, pos, gedrukte data of enige geskikte dokumentasie. Dit is 'n algemene metode om gedrukte tekste te digitaliseer sodat hulle elektronies geredigeer, deursoek, meer kompak gestoor, aanlyn vertoon en gebruik word in masjienprosesse soos kognitiewe rekenaars, masjienvertaling, (onttrek) teks-na-spraak, sleuteldata en teksontginning. Optiese karakterlesing is 'n veld van navorsing in patroonherkenning, kunsmatige intelligensie en rekenaarvisie.[2]

Vroeë weergawes moes opgelei word met beelde van elke karakter, en het net met een lettertipe op 'n slag gewerk. Gevorderde stelsels wat in staat is om 'n hoë mate van akkuraatheid vir die meeste lettertipes te produseer, is nou algemeen, en met ondersteuning vir 'n verskeidenheid beeldlêerformaatinsette. Sommige stelsels is in staat om geformateerde afvoer te reproduseer wat naby aan die oorspronklike bladsy kom, insluitend beelde, kolomme en ander nie-tekstuele komponente.[3][4][5]

Verwysings

wysig
  1. "OCR Document". HP Autonomy#Products and services. Geargiveer vanaf die oorspronklike op 15 April 2016.
  2. "Supported Media Formats". Haven OnDemand. Geargiveer vanaf die oorspronklike op 19 April 2016.
  3. Schantz, Herbert F. (1982). The history of OCR, optical character recognition. [Manchester Center, Vt.]: Recognition Technologies Users Association. ISBN 9780943072012.
  4. Dhavale, Sunita Vikrant (2017). Advanced Image-Based Spam Detection and Filtering Techniques. Hershey, PA: IGI Global. p. 91. ISBN 9781683180142.
  5. d'Albe, E. E. F. (1 Julie 1914). "On a Type-Reading Optophone". Proceedings of the Royal Society A: Mathematical, Physical and Engineering Sciences. 90 (619): 373–375. Bibcode:1914RSPSA..90..373D. doi:10.1098/rspa.1914.0061.