OCR : freeware et en ligne
Par Raphael BESSON, lundi 26 mai 2008 à 22:33 :: Sur mon PC ::#414
Que ce soit au boulot ou chez soi, de plus en plus d’utilisateurs d’ordinateur disposent d’un scanner (ou scanneur ou numériseur).
Bien que très utile, cette outil révèle assez vite une frustration : impossible de récupérer du texte numérisé dans un traitement de texte. En effet, par défaut, le texte est considéré comme une image (une suite de points de noir & blanc ou de couleurs) et non comme une suite de caractères. Pour obtenir une suite de caractères, il faut un logiciel d’OCR pour optical character recognition, reconnaissance optique de caractères (ROC) en français. Ce logiciel va traduire en caractères les images de caractères, en tentant de reconstruire le texte de manière fidèle.
Souvent très cher, des solutions alternatives pour des usages occasionnels existent :
- une solution en ligne sur ce site http://ocr1.sc.isc.tohoku.ac.jp/e1/ (attention aux documents sensibles confiés à un site tiers)
- un freeware TopOCR répéré grâce au toujours bon Libellules.ch.
Je n’ai pas encore testé le second mais le premier donne des résultats encourageants, même s’il ne semble plus maintenu depuis 2006, y compris avec des caractères accentués propres au français, ce qui mérite d’être signalé.
Commentaires
Aucun commentaire