Implémentation Java OCR [fermé]

160

C'est principalement une simple curiosité, mais existe-t-il des implémentations OCR en Java pur? Je suis curieux de savoir comment cela fonctionnerait uniquement en Java, et l'OCR en général m'intéresse, alors j'aimerais voir comment il est implémenté dans un langage que je comprends parfaitement. Naturellement, cela nécessiterait que l'implémentation soit open source, mais je suis toujours intéressé par des solutions propriétaires, car je pourrais au moins vérifier les performances dans ce cas.

J'en ai vu quelques-uns qui peuvent être utilisés en Java (comme Asprise ) mais il ne semble pas que ce soient des implémentations Java pures ... y en a-t-il?

rat
la source
@Robik Tout d'abord, pendant que vous y êtes, vous devez également supprimer les remerciements inutiles, etc. Et deuxièmement, vous ne devez pas modifier une telle hypothèse, surtout si OP est toujours actif et que vous pouvez simplement commenter - bien que vrai dans ce cas ... @ rat Juste pour clarifier, vouliez-vous dire une surprise?
Tobias Kienzler
Si vous ne recherchez pas une approche purement Java, la construction d'un pont JNI (comme Tess4J ) a peut-être du sens. Mon sentiment est que les bibliothèques OCR sont mieux représentées dans le monde C ++ (OCRAD, GOCR, Cuneiform - voir tout ici ).
dma_k
@rat - Vous avez raison - Le SDK Asprise OCR pour Java n'est pas basé sur Java pur. En fait, dans les coulisses, le code natif est utilisé car l'OCR est un processus très coûteux en calcul.
Assistance Asprise

Réponses:

81

Je recommande d'essayer le projet Java OCR sur sourceforge.net. Je l'ai développé à l'origine et j'ai un blog à ce sujet .

Depuis que je l'ai mis en place sur sourceforge, ses fonctionnalités ont été étendues et améliorées un peu grâce à l'excellent travail d'un chercheur / développeur bénévole.

Essayez-le et si vous ne l'aimez pas, vous pouvez toujours l'améliorer!

Ron
la source
18
@Ron J'ai aussi jeté un œil au projet. Je n'ai pas trouvé la démo et l'interface graphique effectue diverses opérations graphiques, mais il n'y a pas d'instructions sur la façon d'obtenir la reconnaissance de caractères réelle.
James P.
1
@Ron lorsque je suis le lien vers votre blog, je vois une page vierge.
neoneye
3
@Ron où puis-je obtenir une documentation ou un blog supplémentaire ou un tutoriel.
altsyset
1
comment importer java ocr dans eclipse?
Faisal Ashraf
2
Salut, y a-t-il des tutoriels pour cela?
The Well
10

Nous avons testé quelques moteurs OCR avec Java comme Tesseract, Asprise, Abbyy etc. Dans notre analyse, Abbyy a donné les meilleurs résultats.

Ciel bleu
la source
1
API Java ou implémentations Java ..?
Ewoks
Ni l'un ni l'autre, mais il existe une version en ligne de commande à laquelle vous pouvez parler ProcessBuilder.
Aaron Digulla
1
Ni Tesseract ni Abbyy ne sont basés sur Java. Ils ont simplement des API pour Java.
krispy
10

Si vous recherchez une option très extensible ou si vous avez un domaine de problème spécifique, vous pouvez envisager de lancer le vôtre à l'aide du moteur neuronal Java Object Oriented . Un autre JOONE référence .

Je l'ai utilisé avec succès dans un projet personnel pour identifier la lettre à partir d'une image comme celle- ci , vous pouvez trouver toute la source du composant OCR de mon application sur github, ici .

Davetapley
la source
1
Ooh, merci pour l'exemple. Je l'ai téléchargé et j'ai l'intention de l'adapter à mes propres besoins!
Amanda S
Pouvez-vous me montrer comment compiler?
RadijatoR
J'ai peur que le projet ne soit plus maintenu @RadijatoR, donc je ne peux pas donner de conseils.
davetapley
4
La plupart des liens sont morts.
Erik le
5

Il existe une variété de bibliothèques OCR. Cependant, mon expérience est que les principales implémentations commerciales, ABBYY, Omnipage et ReadIris, surpassent de loin les implémentations open-source ou autres implémentations mineures. Ces bibliothèques commerciales ne sont pas principalement conçues pour fonctionner avec Java, bien que cela soit bien sûr possible.

Bien sûr, si votre intérêt est d'apprendre le code, les implémentations open source feront l'affaire.

Joshua Fox
la source