Comment extraire du texte d'un PDF qui n'a pas été construit avec un index? C'est tout le texte, mais je ne peux rien rechercher ou sélectionner. Je suis sous Kubuntu, et Okular ne possède pas cette
La reconnaissance optique de caractères (OCR) est le processus de conversion d'images de texte en texte qui peut être manipulé par des traitements de texte, etc.
Aujourd'hui, j'ai reçu un PDF de notre fournisseur et il contenait plusieurs pages imprimées et numérisées avec des signatures, etc. Je l'ai ouvert dans Acrobat Reader DC. Mais à ma grande surprise, le texte des images manifestement numérisées a pu être sélectionné et copié sous forme de texte....
Cela a été discuté il y a un an ici: OCR par lots pour de nombreux fichiers PDF (pas déjà OCR)? Existe-t-il un moyen de grouper des PDF OCR qui n'ont pas déjà été OCR? Tel est, je pense, l'état actuel des choses concernant deux questions: PDF OCR par lots les fenêtres Acrobat - Il s'agit du moteur...
Fermé. Cette question est hors sujet . Il n'accepte pas actuellement de réponses. Voulez-vous améliorer cette question? Mettez à jour la question afin qu'elle soit sur le sujet pour Super User. Fermé il y a 4 ans . J'ai un PDF d'un livre numérisé. Je suis à la recherche d'un logiciel gratuit qui...
Fermé. Cette question est hors sujet . Il n'accepte pas actuellement les réponses. Voulez-vous améliorer cette question? Mettez à jour la question afin qu'elle soit sur le sujet pour le super utilisateur. Fermé il y a 4 ans . Plusieurs fois, je rencontre des bitmaps avec uniquement des paragraphes...
Je recherche sur Google depuis un certain temps, mais je ne trouve pas de réponse à ma question. J'ai des couches d'OCR indésirables dans un document que j'ai récemment numérisé avec Adobe Acrobat. Il n'a pas été correctement OCR, et je souhaite supprimer certaines informations, mais l'OCR fait...
Evernote effectue l'OCR sur les images que vous y enregistrez. Existe-t-il un moyen d'obtenir l'équivalent en texte intégral d'une image dans Evernote, ou l'OCR est-il uniquement destiné à la
J'étais chez mon grand-parent le week-end dernier. Ma grand-mère a sorti ce livre géant (~ 1400 pages) de son histoire familiale remontant à 1630 environ. Ballot géant que je suis, je pensais que ce serait génial d'avoir toutes les informations stockées dans une base de données et disponibles sur...
Ce PDF a été produit par Abbyy Finereader 10: http://ebooks.zeitr.org/from_abbyy.pdf Vous pouvez copier et coller la première phrase et obtenir ce (très bon) résultat texte: Der »Bund Deutscher Gymnastik-Schulleiter« wurde am 20. November 1955 anläßlich einer Zusammenkunft der Leiterinnen und...
J'ai utilisé SimpleOCR , qui a une belle interface graphique pour corriger les erreurs. Malheureusement, cela fait beaucoup d'erreurs! (et souffre d'autres bugs et limitations) D'un autre côté, Tesseract est plus précis mais n'a aucune interface graphique. Ma question est, existe-t-il un programme...
Fermé. Cette question est hors sujet . Il n'accepte pas actuellement les réponses. Voulez-vous améliorer cette question? Mettez à jour la question afin qu'elle soit sur le sujet pour le super utilisateur. Fermé il y a 5 ans . J'utilise Google Desktop Search (je suis sous Vista) et tous mes...
Le traitement OCR prend du temps. L'utilisation de plusieurs cœurs de processeur accélérerait le traitement. Acrobat 10 n'était pas une application multithread . Que diriez-vous d'Acrobat 11? Par défaut, 11 utilise-t-il l'OCR en utilisant plusieurs cœurs de processeur (si disponible)? Sinon,...
Comment lancer une numérisation et une reconnaissance de caractères à l'aide de Microsoft Office Word 2010 (bêta)? Je n'arrive pas à trouver une option pour numériser le document dans mon scanner directement dans un document Word 2010. J'ai vérifié les paramètres d'installation d'Office 2010 (bêta)...
Je ne parviens pas à lire un fichier PDF sur mon Kindle parce que le texte OCR est affiché sur deux colonnes par page. (Le livre a été numérisé deux fois à la fois, en OCR.) Comment puis-je le formater en une colonne (ou n'importe quel style) pour pouvoir le lire sur mon
Je recherche un site Web OCR en ligne permettant de traiter simultanément un fichier PDF de plusieurs pages. Gratuit de préférence. Je sais http://www.newocr.com/ . Si je ne me trompe pas, il ne peut exécuter qu'une seule page à la fois, en cliquant manuellement sur "Aperçu" puis en cliquant sur...
OneNote propose une excellente fonctionnalité OCR dans laquelle vous pouvez sélectionner une image et cliquer dessus. make text in image searchable. Mais j'aimerais que cette option soit activée par défaut pour toutes les images que je colle dans OneNote - est-ce possible? ( actuellement, il...
Je cherche un logiciel capable de reconstruire les pixels exacts à partir d'une photo d'un vieux jeu vidéo ou d'un pixel art. L’objectif serait la re-numérisation des images numériques qui n’ont survécu que dans une copie analogique, par exemple les images de Mario Paint qui ont été capturées sur...
Je recherche une solution pour accélérer mon processus de numérisation de documents, en particulier pour les documents qui ne conviennent pas à un numériseur de documents classique doté d'un chargeur automatique de documents (ADF). Pour ces documents, j'utilise actuellement un scanner à plat. Au...
J'ai un graphique relativement simple. un schéma technique avec divers bouts de texte. Le texte est dans une autre langue (tchèque / slovaque). Il est suffisamment imprimé pour être distingué et interprété avec précision par l'OCR (Android) de Google Translate. Quoi qu'il en soit, j'aimerais...
Comment importer une table à partir d'un fichier d'image numérisée (jpg / pdf) vers un tableur? Exemple d'analyse est