Solution OCR pour les factures légales [fermé]

1

J'ai différents types de factures de facturation légales. Je veux les numériser dans des feuilles Excel. Étant donné que leurs agencements sont différents et qu’ils sont nombreux, je ne trouve pas le moyen de les traiter. Est-ce que quelqu'un peut me fournir une solution pratique?

Willams
la source
Je recommanderais omnipage, mais ils fermeront sûrement ce sujet comme étant hors sujet, alors magasinez, consultez alternativeto.net pour consulter les alertes à omnippage si cela ne vous convient pas.
MDT Guy
Merci, j'ai essayé l'omnipage et Abbyy, il semble qu'ils ne fournissent que les produits. Ils convertissent l'image en texte, mais ils ne peuvent effectuer aucun calcul ni aucune extraction. Y at-il une solution sur le traitement d'une telle chose? Merci beaucoup quand même.
Willams
Oh, vous cherchez un ECM avec OCR? Pas juste un OCR? Je ne sais pas si vous avez besoin de Docuware, c'est peut-être excessif, mais vérifiez-le. Nous l'utilisons pour nos factures.
Guy MDT

Réponses:

2

Il n'y a pas de bonne solution à un prix raisonnable que je connaisse :(

Vous pouvez essayer de consulter Nuance OmniPage ou Abby FlexiCapture (il existe des éditions de bureau jusqu’à 100 000 dollars). Il y a quelque temps, j'avais comparé la qualité des SDK / OCR entre eux. Pas beaucoup de différence, même si j’ai senti qu’Abbyy était un peu plus jeune (Nuance s’est écrasé plusieurs fois, mais Abbyy ne l’a pas fait).

OmniPage et FlexiCapture (FineReader) disposent tous deux d'éditions de bureau censées convertir les PDF en fichiers Excel modifiables. Ce que j’ai appris en bricolant avec les versions d’essai gratuites, c’est qu’elles créent des fichiers Excel modifiables, mais uniquement pour des sources propres de très haute qualité. Les deux offrent également une fonctionnalité de traitement par lots.

Aussi, j'ai trouvé que scanstore.com était une ressource incroyable:

http://www.scanstore.com/Scanning_Software/Forms_Processing/Invoice_Processing/

Si vous recherchez une source ouverte, le meilleur "moteur" est tesseract. Vous aurez besoin de construire l'ensemble des formes de capture peu autour d'elle. J'ai réfléchi à cela - et vous aurez besoin de:

  1. Utilisez des «codes à barres» ou enregistrez d'autres types de factures
  2. Pour chaque type - déterminez quelles parties de la facture sont des tables
  3. Recadrez la zone concernée - et envoyez-la à tesserat / abbyy / nuance
  4. Récupérer quelque chose qui peut être analysé dans une table
  5. Appliquez la modélisation du langage (étonnamment Abbyy, Nuance fait un travail terrible ici)

Oh et FYI, il y a beaucoup de sociétés de services "BPO" qui ont de vraies personnes pour faire le travail de saisie de données. Ce n'est pas aussi cher qu'on pourrait le penser.

Grynn
la source
Oui, la société OCR a vraiment besoin de gros frais, et votre réflexion sur le traitement des factures est très utile. Mais cela ne signifie pas que je devrais employer un ingénieur, non? Je pense que je devrais trouver une entreprise qui fait ces choses pour moi. Merci pour vos réponses.
Willams
1

Voici quelques logiciels d’OCR gratuits: CuneiForm, GOCR, Ocrad, OCRopus, Tesseract. Mais le résultat n'est pas si bon. Mais vous pouvez essayer FineReader, ExperVision, OmniPage, le résultat sera meilleur. Cependant, selon mon expérience, vous ne pouvez pas compter sur la solution technologique pure. Si vous souhaitez contrôler le coût de votre projet à un prix raisonnable. Intégrer la technologie OCR et les ressources humaines est un bon choix. Autant que je sache, Expervision peut fournir à la fois une technologie OCR personnalisée et un service BPO. Vous pouvez consulter leur site Web. Expervision

Lincoln1985
la source