Dans Ubuntu 12.10, si je tape
gnome-screenshot -a | tesseract output
il renvoie:
** Message: Unable to use GNOME Shell's builtin screenshot interface, resorting to fallback X11.
Comment puis-je sélectionner un texte à l'écran et le convertir en texte (presse-papiers ou document)?
Merci!
gnome-screenshot -a
? Aussi pourquoi vous dirigez la sortie vers tesseract? Si je ne me trompe pas, gnome-screenshot enregistre l'image dans un fichier et ne "l'imprime" pas ...auto-save-directory
? Et cela a-t-il laissé quelque chose là-dedans? Lien intéressant: forums.debian.net/viewtopic.php?f=6&t=85683Réponses:
Peut-être qu'il existe déjà un outil qui fait cela, mais vous pouvez également créer un script simple avec un outil de capture d'écran et un tesseract, comme vous essayez de l'utiliser.
Prenons comme exemple ce script (dans mon système, je l'ai enregistré sous
/usr/local/bin/screen_ts
):Et avec le support du presse-papiers:
Il permet
scrot
de prendre l'écran,tesseract
de reconnaître le texte etcat
d'afficher le résultat. La version presse-papiers utilise égalementxsel
pour diriger la sortie dans le presse-papiers.REMARQUE :
scrot
,xsel
,imagemagick
ettesseract-ocr
ne sont pas installés par défaut , mais sont disponibles à partir des référentiels par défaut.Vous pourrez peut-être le remplacer
scrot
pargnome-screenshot
, mais cela peut prendre beaucoup de travail. En ce qui concerne la sortie, vous pouvez utiliser tout ce qui peut lire un fichier texte (ouvrez-le avec l'éditeur de texte, affichez le texte reconnu comme une notification, etc.).Version GUI du script
Voici une version graphique simple du script OCR comprenant une boîte de dialogue de sélection de la langue:
Mis à part les dépendances répertoriées ci-dessus, vous devrez installer le fork Zenity YAD à partir du webupd8 PPA pour faire fonctionner le script.
la source
rm $SCR_IMG.png $SCR_IMG.txt
).scrot
par lui-même ne peut pas utiliser le presse-papiers. Mais il existe des outils commexclip
ouxsel
qui peuvent faire ce dont vous avez besoin pour copier / coller du texte.| clipboard
à la fin de la dernière ligne du script de Salem.Je ne sais pas si quelqu'un a besoin de ma solution. En voici un qui fonctionne avec Wayland.
Il montre la reconnaissance des caractères dans un éditeur de texte et si vous ajoutez le paramètre "oui", vous obtenez la traduction de l'outil de protection des lunettes (la connexion Internet est obligatoire) Avant de pouvoir l'utiliser, installez tesseract-ocr imagemagick et google-trans. Démarrez le script, c'est-à-dire dans gnome avec Alt + F2 lorsque vous voyez votre texte que vous souhaitez reconnaître. Déplacez le coursier autour du texte. C'est ça. Ce script a été testé uniquement pour gnome. Pour les autres gestionnaires de fenêtres, il doit être adapté. Pour traduire le texte dans d'autres langues, remplacez l'ID de langue à la ligne 25.
la source
Je viens de faire un blog sur la façon d'utiliser la capture d'écran de nos jours. Même si je cible le chinois, la diffusion d'écran et le code sont en anglais. L'OCR n'est qu'une des fonctionnalités.
Fonctionnalité pour mon OCR:
Ouvrez dans konsole + vimx OU gedit pour poursuivre la modification.
Pour vimx + anglais, activez la vérification orthographique.
Prend en charge la sélection de langue dynamique sans code dur.
Boîte de dialogue de progression lors de la conversion et de la tesseraction, ce qui est lent.
Code de fonction:
Code de l'appelant:
Combinez ce code 2 dans un script shell unique pour exécuter.
Capture d'écran 1:
Capture d'écran 2:
la source
L'idée est à chaque fois qu'un nouveau fichier de capture d'écran apparaît dans le dossier exécutez tesseract OCR et ouvrez-le dans un éditeur de fichiers.
Vous pouvez laisser ce script en cours d'exécution dans le répertoire de sortie de votre répertoire de sortie de capture d'écran préféré
Vous en aurez besoin pour être installé
la source
J'ai créé un programme gratuit et open source à cet effet:
https://danpla.github.io/dpscreenocr/
la source