Recunoașterea optică a caracterelor

Recunoașterea Optică a Caracterelor (engleză Optical character recognition), abreviată și OCR, reprezintă translatarea mecanică sau electronică a imaginilor cu scris de mână, tipărit sau printat (de obicei scanat) în text editabil.

OCR este un domeniu de cercetare în recunoașterea modelelor, inteligența artificială și vederea mecanică. Recunoașterea optică a caracterelor (folosind metode optice ca oglinzi și lentile) și recunoașterea digitală a caracterelor (folosind scanere și algoritmi pe calculator) au fost, inițial, considerate domenii diferite. Deoarece puține aplicații folosesc tehnici optice, termenul OCR include și procesarea digitală a documentelor.

Programele inițiale necesitau învățarea caracterelor (exemple ale fiecărui caracter) pentru a identifica un font specific. Astăzi există programe „inteligente” care au un grad mai mare de acuratețe, putând identifica majoritatea fonturilor. Unele programe sunt chiar capabile de a aranja textul pe coloane, imaginile și elementele non-textuale în pagină aproape identic cu sursa originală.

Legături externe

  • ICDAR'07 Arhivat în , la Wayback Machine., ICDAR'09, o sursă cuprinzătoare despre aspectele recunoașterii scrisului din documente
  • Linux OCR: Un studiu despre programele gratuite OCR Arhivat în , la Wayback Machine.
  • 17 Things Arhivat în , la Wayback Machine. Explicarea principiului și istoriei recunoașterii scrisului de mână

Vezi și

  • ABBYY FineReader
  • CAPTCHA
  • MediaWiki:Captchahelp-text