Recunoașterea optică a caracterelor

Recunoașterea Optică a Caracterelor (engleză Optical character recognition), abreviată și OCR, reprezintă translatarea mecanică sau electronică a imaginilor cu scris de mână, tipărit sau printat (de obicei scanat) în text editabil.

OCR este un domeniu de cercetare în recunoașterea modelelor, inteligența artificială și vederea mecanică. Recunoașterea optică a caracterelor (folosind metode optice ca oglinzi și lentile) și recunoașterea digitală a caracterelor (folosind scanere și algoritmi pe calculator) au fost, inițial, considerate domenii diferite. Deoarece puține aplicații folosesc tehnici optice, termenul OCR include și procesarea digitală a documentelor.

Programele inițiale necesitau învățarea caracterelor (exemple ale fiecărui caracter) pentru a identifica un font specific. Astăzi există programe „inteligente” care au un grad mai mare de acuratețe, putând identifica majoritatea fonturilor. Unele programe sunt chiar capabile de a aranja textul pe coloane, imaginile și elementele non-textuale în pagină aproape identic cu sursa originală.

Legături externe

ICDAR'07 Arhivat în 13 iulie 2009, la Wayback Machine., ICDAR'09, o sursă cuprinzătoare despre aspectele recunoașterii scrisului din documente
Linux OCR: Un studiu despre programele gratuite OCR Arhivat în 19 decembrie 2007, la Wayback Machine.
17 Things Arhivat în 24 mai 2009, la Wayback Machine. Explicarea principiului și istoriei recunoașterii scrisului de mână