Maskinläsning

Den här artikeln handlar om optisk teckenigenkänning och -tolkning. För referensnummer på svenska inbetalningskort, se OCR-nummer.
Maskinläsning med läspenna.

Maskinläsning[1]eller optisk teckenläsning[2] (ofta förkortat OCR efter engelskans Optical Character Recognition) kallas datortekniken att med hjälp av bildanalys förvandla digitala bilder av tryckt text till bokstäver och siffror som andra datorprogram, till exempel ordbehandlare, kan använda.

Den varierande kvaliteten på tryckt text kan göra denna texttydning svår ibland, så därför har många program för maskinläsning en inlärningsfunktion, där användaren kan hjälpa programmet att förstå hur vissa tecken ska tydas.

Historia

Maskinläsning kom i bruk på 1960-talet för hantering av checkar, inbetalningskort och liknande. Tekniken krävde då att texten var tryckt med speciella typsnitt som minskade risken för felläsning. På 1970-talet uppfann Ray Kurzweil en maskinläsningsteknik som klarar alla vanliga typsnitt, och numera finns det program för maskinläsning som kan köras på vilken persondator som helst. Med hjälp av en bildläsare förvandlas den tryckta texten till en digital bild, som maskinläsningsprogrammet sedan analyserar.

Referenser

  • Maskininläsning på "IT-ord" från Computer Sweden
  1. ^ Computer Swedens rekommenderade svenska term för "optical character recognition" Läst 1 november 2021
  2. ^ Microsofts svenska term för "optical character recognition" Länkad 2012-09-17

Se även

v  r
Differentierbar datoranvändning
General
Differentierbar programmering Neural Turing maskin Differentierbar neural dator Automatisk differentiering Neuromorf ingenjörskonst Cable theory Mönsterigenkänning Beräkningslärandeteori Tensorkalkyl
Begrepp
Gradient descent SGD Klusteranalys Regression Overfitting Adversary Attention Faltning Förlustfunktioner Backpropagation Normalization Activation Softmax Sigmoid Rectifier Regularization Datasets Augmentation
Programmeringsspråk
Python Julia
Applikationer
Maskininlärning Artificiellt neuronnät Djupinlärning Numerisk analys Federerad inlärning Artificiell intelligens
Hårdvara
IPU TPU VPU Memristor SpiNNaker
Mjukvarubibliotek
TensorFlow PyTorch Keras Theano
Implementation
Audiovisuellt
Verbal
Word2vec Transformator BERT NMT Project Debater Watson GPT-2 GPT-3
Beslutande
Alphago AlphaZero Q-learning SARSA OpenAI Five Självkörande bil MuZero Action selection Robot control
Personer
Alex Graves Ian Goodfellow Yoshua Bengio Geoffrey Hinton Yann LeCun Andrew Ng Demis Hassabis David Silver Fei-Fei Li
Organisationer
Deepmind Hi! PARIS Openai MIT CSAIL Mila Google Brain