Pengecaman aksara optik

Video proses mengimbas dan pengecaman aksara optik masa nyata (OCR) dengan pengimbas mudah alih.

Pengecaman aksara optik^[1]^[2] (bahasa Inggeris: optical character recognitioncode: en is deprecated , OCR) ialah penukaran elektronik atau mekanikal imej teks wakilan suatu aksara yang ditaip, ditulis tangan atau dicetak atas kertas kepada teks terkod mesin diselarikan,^[1] sama ada dari dokumen terimbas, foto dokumen mahupun pemandangan (contohnya teks pada papan tanda dan papan iklan dalam foto landskap) atau dari teks sari kata tertindih pada suatu imej (contohnya: dari siaran televisyen)^[3] dalam suatu alat khusus (pembaca aksara optik, optical character readercode: en is deprecated ^[4]).

Kaedah ini umum dalam pendigitan teks tercetak agar ia boleh disunting secara elektronik, dicari, disimpan dengan lebih padat, dipapar pada baris, dan digunakan dalam proses mesin seperti pengkomputan kognitif, terjemahan mesin, teks-ke-tutur (tersari), data utama dan perlombongan teks. Ia luas digunakan sebagai bentuk kemasukan data dari rekod data kertas tercetak terutamanya dalam penghantaran maklumat peribadi mahupun kewangan^[2] – sama ada dokumen pasport, invois, penyata bank, resit berkomputer, kad perniagaan, surat, cetakan data statik, atau mana-mana pendokumenan yang sesuai. Teknologi ini tercakup penyelidikan dalam bidang-bidang pengecaman corak, kecerdasan buatan dan penglihatan komputer.

Versi awal perlu dilatih dengan imej setiap aksara, dan berfungsi pada satu fon pada satu masa. Sistem lanjutan berupaya menghasilkan darjah tinggi kejituan pengecaman bagi kebanyakan fon yang kini umum, dan dengan sokongan untuk pelbagai input format fail imej digital.^[5] Beberapa sistem berupaya menerbit semula output terformat yang hampir dekat dengan halaman asal termasuk imej, lajur, dan komponen bukan teks yang lain.

Lihat juga

Kesan AI
Penggunaan kecerdasan buatan
Perbandingan perisian pengecaman aksara optik
Linguistik pengiraan
Perpustakaan digital
Bilik mel digital
Pen digital
Repositori institusi
Mudah baca
Senarai teknologi memuncul
Penyelesaian pengecaman aksara dakwat langsung
Pengecaman aksara dakwat magnet
OCR muzik
OCR dalam bahasa-bahasa India
Pengecaman tanda optik
Kerangka kecerdasan buatan
Pengecaman lakaran
Pengecaman pertuturan
Enjin OCR Tesseract
Perakaman suara

Rujukan

^ ^a ^b Rao dkk., "pengecaman aksara optik", m/s. 56
^ ^a ^b Muhammad Mun'im Ahmad Zabidi (1996). Asas Organisasi Sistem Komputer. Skudai, Johor: Penerbit Universiti Teknologi Malaysia. m/s. 110–111. ISBN 983-52-0057-2.
^ OnDemand, HPE Haven. "OCR Document". Diarkibkan daripada yang asal pada 15 April 2016.
^ Rao dkk., "pembaca aksara optik", m/s. 48
^ OnDemand, HPE Haven. "undefined". Diarkibkan daripada yang asal pada 19 April 2016.

Sumber utama

G. S. Rao, A. K. Rao, Ng Chee Aun & Cheng Yok San (1991). Kamus Komputer Sekolah Menengah. Penerbit Fajar Bakti Sdn Bhd. ISBN 967-65-1306-7.CS1 maint: uses authors parameter (link)

Pautan luar

Unicode OCR – Hex Range: 2440-245F Pengecaman Aksara Optik dalam Unicode (dalam bahasa Inggeris)
Bibliografi anotasi rujukan untuk pengenalan karakter tulisan tangan dan pengkomputeran pen (dalam bahasa Inggeris)