C'est principalement une simple curiosité, mais existe-t-il des implémentations OCR en Java pur? Je suis curieux de savoir comment cela fonctionnerait uniquement en Java, et l'OCR en général m'intéresse, alors j'aimerais voir comment il est implémenté dans un langage que je comprends parfaitement. Naturellement, cela nécessiterait que l'implémentation soit open source, mais je suis toujours intéressé par des solutions propriétaires, car je pourrais au moins vérifier les performances dans ce cas.
J'en ai vu quelques-uns qui peuvent être utilisés en Java (comme Asprise ) mais il ne semble pas que ce soient des implémentations Java pures ... y en a-t-il?
Réponses:
Je recommande d'essayer le projet Java OCR sur sourceforge.net. Je l'ai développé à l'origine et j'ai un blog à ce sujet .
Depuis que je l'ai mis en place sur sourceforge, ses fonctionnalités ont été étendues et améliorées un peu grâce à l'excellent travail d'un chercheur / développeur bénévole.
Essayez-le et si vous ne l'aimez pas, vous pouvez toujours l'améliorer!
la source
Nous avons testé quelques moteurs OCR avec Java comme Tesseract, Asprise, Abbyy etc. Dans notre analyse, Abbyy a donné les meilleurs résultats.
la source
ProcessBuilder
.Si vous recherchez une option très extensible ou si vous avez un domaine de problème spécifique, vous pouvez envisager de lancer le vôtre à l'aide du moteur neuronal Java Object Oriented . Un autre JOONE référence .
Je l'ai utilisé avec succès dans un projet personnel pour identifier la lettre à partir d'une image comme celle- ci , vous pouvez trouver toute la source du composant OCR de mon application sur github, ici .
la source
Il existe une variété de bibliothèques OCR. Cependant, mon expérience est que les principales implémentations commerciales, ABBYY, Omnipage et ReadIris, surpassent de loin les implémentations open-source ou autres implémentations mineures. Ces bibliothèques commerciales ne sont pas principalement conçues pour fonctionner avec Java, bien que cela soit bien sûr possible.
Bien sûr, si votre intérêt est d'apprendre le code, les implémentations open source feront l'affaire.
la source
Je viens de trouver celui-ci (je ne le sais pas, pas testé, vérifiez vous-même)
Ron Cemer Java OCR
Comme vous n'en avez besoin que par curiosité, vous pouvez rechercher la source de cette applet.
Il fait l'OCR des caractères manuscrits avec un réseau neuronal
Java OCR: reconnaissance de l'écriture manuscrite
la source