Je voudrais numériser une bonne quantité de papiers que je traîne, avec le moins de tracas possible. Je souhaite les convertir en images à l'aide de la numérisation simple, puis les convertir en texte à l'aide de l'OCR. Existe-t-il une bonne application OCR avec une interface graphique qui me donnera de bons résultats en appuyant simplement sur un bouton?
78
Réponses:
GOCR from est un programme OCR (Reconnaissance Optique de Caractères). Il convertit les images numérisées de texte en fichiers texte.
CLARA est une autre bonne option graphique.
OCRAD from est un OCR pouvant être utilisé en tant qu'application console autonome ou en tant que serveur principal pour d'autres programmes.
KOOKA de est une application KDE mais fonctionne très bien. En outre, vous devez installer les programmes OCR réels tels que GOCR et OCRAD.Après l’installation de Kooka et des programmes OCR, vous devez pointer Kooka vers l’emplacement d’installation de la ROC afin de le convertir le JPEG en texte.
OCRFeeder de est un système d’analyse de mise en page de document et de reconnaissance optique de caractères.
Tesseract à partir estutilitaire de lignecommande et il est très simple à use.You peut installerpaquet de langue tesseract-ocr-eng d' ici .
Regardez cette page .
Remarque:
pour exécuter le terminal tesseract goto et tapez ce qui suit
Tesseract ne peut lire qu'un fichier TIFF. Si vous avez un fichier JPEG ou PDF, vous devrez le convertir. En outre, l’extension du nom de fichier doit être .tif, pas .tiff, sinon tesseract error out.
la source
tesseract
(3.04.00 sur Ubuntu 15.10) n'a actuellement aucun problème avecPNG
les fichiers d'entrée. il accepte lesJPG
fichiers, mais leur résultat est pire, comme on pourrait s'y attendre avec des artefacts de compression supplémentaires.Il existe quelques outils de ligne de commande OCR populaires que vous pouvez utiliser (je ne sais pas s'ils ont une interface graphique):
Tesseract ( ReadMe , FAQ ) (Python)
Egalement disponible pour: Tesseract .NET , Tesseract iOS
Usage:
GOCR
OCRopus ™ ( FAQ ) (écrit en Python, NumPy et SciPy)
Tessnet2 (Open source, OCR, Tesseract, .NET, DOTNET, C #, VB.NET, C ++ / CLI)
Quelques autres: OCR ABBYY CLI pour Linux , OCR Asprise
Pour une liste plus complète, consultez: Liste des logiciels de reconnaissance optique de caractères sur Wikipedia
Voir aussi:
wanghaisheng/awesome-ocr
- Une liste organisée de ressources OCR prometteuses sur GitHub.la source
linux-intelligent-ocr-solution
disclaimer - Je suis étroitement associé au développement de cette solution opensource
Lios peut convertir une impression en texte à l'aide d'un scanner ou d'un appareil photo.
Il peut également produire du texte à partir d'images numérisées provenant d'autres sources, telles que des fichiers PDF, des images ou des dossiers contenant des images.
Le programme est totalement accessible aux malvoyants.
Depuis que je suis étroitement connecté - j'aimerais des commentaires.
la source
Gscan2PDF
OCR sur plusieurs pages PDF ou documents numérisés
C'est probablement le moyen le plus simple. Gscan2pdf est un outil graphique qui vous permet non seulement de numériser des fichiers, mais également d'importer des fichiers et d'y effectuer des opérations de ROC. Installez gscan2pdf à partir d’ici , à partir du Centre de logiciel Ubuntu ou en exécutant cette commande dans un terminal:
Gscan2PDF peut utiliser des moteurs OCR personnalisables. La valeur par défaut est
tesseract-ocr
Vous pourriez envisager de choisir la langue appropriée. Dans ce cas, vous devrez installer un
tesseract-ocr-LANG
packageLANG
contenant le code de langue à trois lettres ISO 639-2. En ce moment, vous avez 108 langues sur 16.04 repo.la source
Je viens d'avoir du succès (sous 16.04) avec pdfocr.rb . Ceci est listé sur le wiki Ubuntu
Voici un ppa mais le référentiel de 16.04 n'est pas mis à jour. Le script ruby ci-dessus de github fonctionne toujours avec 16.04.
Vous pouvez le télécharger à partir de Github. Vous aurez besoin des packages suivants installés:
puis rendu pdfocr.rb exécutable et exécuté:
Vous pouvez éventuellement utiliser le
-l LANG
paramètre. Dans ce cas, vous devrez installer untesseract-ocr-LANG
packageLANG
contenant le code de langue à trois lettres ISO 639-2. En ce moment, vous avez 108 langues sur 16.04 repo.la source
Le meilleur et le plus simple moyen de l'utiliser
pypdfocr
est de ne pas changer le pdf. pypdfocr est un lien de module python ici.À la fin, vous en aurez une autre
your_document_ocr.pdf
comme vous le souhaitez avec un texte interrogeable. L'application ne change pas la qualité de l'image. Augmente un peu la taille du fichier en ajoutant le texte de surimpression.Je pense que la commande est assez facile car elle ne nécessite aucune interface graphique. Peut-être que l'installation de pypdfocr est un peu plus verbeuse:
Mise à jour du 3 novembre 2018:
pypdfocr
n'est plus pris en charge depuis 2016 et j'ai remarqué quelques problèmes dus au fait que je n'étais pas mentalisée.ocrmypdf
( module effectue un travail symiliaire et peut être utilisé comme ceci:À installer:
ou
la source
Tout simplement parce que cela fonctionne très bien et devrait certainement être dans la liste:
Exemple de gimageReader à partir d'une capture d'écran:
Il est dans les pensions (répondu le 18.10, mais l'utilise depuis des lustres)
la source
eng
options ... mais j'ai tout réglé! :) Courirsudo apt install tesseract-ocr-eng
dans le terminal a fait l'affaire. Ce serait bien si cela était documenté dans le fichier d'aide de gimageReader ou dans "README" sur github ... ou quelque part. Comme ici, peut-être.gscan2pdf comprend 3 moteurs ocr différents. Vous pouvez numériser directement dans le programme ou importer votre pdf dans le programme. J'ai trouvé le moteur Tesseract très efficace et très facile à utiliser
la source