Les meilleurs paramètres de l'appareil photo pour photographier du texte?

11

J'utilise mon S95 pour photographier des documents texte (papier et microfilm) pour l'OCR. J'ai déjà posé des questions sur la meilleure façon de photographier un écran d'ordinateur pour un microfilm, mais j'ai réfléchi à la meilleure façon de photographier du texte pour que le texte soit clair et net. Voici mes pensées actuelles, mais j'aimerais entendre ce que toute personne ayant plus d'expérience en photographie que moi a à dire:

  1. J'utilise un plus petit nombre de mégapixels (environ 6-7MP plutôt que le maximum du S95, qui est de 10MP), afin que les fichiers PDF résultants ne tuent pas mon ordinateur lorsque je vais les faire défiler

  2. Ouverture - inférieure (par exemple f / 6.3), de sorte que si l'appareil photo n'est pas exactement parallèle à la page, le texte restera net

  3. Vitesse d'obturation - Il y a un compromis ici, car les bibliothèques sont généralement à faible luminosité, donc j'aimerais réduire la vitesse d'obturation pour augmenter l'exposition, mais sans trépied, il y a une possibilité d'oscillation de l'appareil photo

  4. ISO - Je ne sais pas vraiment comment cela pourrait l'affecter.

  5. Balance des blancs - Encore une fois, pas vraiment sûr.

J'ai expérimenté différents paramètres sur mon appareil photo, mais j'apprends simplement la photographie et je voudrais savoir si quelqu'un a des suggestions sur la meilleure façon de photographier du texte, à partir de livres ou de documents, qui est facile à lire.

Jason
la source
3
Pourquoi ne pas simplement utiliser le bon outil pour le travail et utiliser un scanner?
ahockley
7
"Pourquoi ne pas simplement utiliser le bon outil pour le travail et utiliser un scanner?" - Parce que la plupart des documents avec lesquels je travaille ne sont pas numérisables. Ils sont soit très fragiles, soit la bibliothèque ne vous permet pas de numériser, soit la bibliothèque facture des coûts exorbitants pour numériser plus de 0,50 $ / page.
Jason
2
Je voudrais que cela soit dit: j'espère que vos utilisations respectent de manière appropriée les droits d'auteur, si elles sont pertinentes. :) En supposant que oui, j'espère que vous trouverez vos réponses!
lindes
3
"J'espère que vos utilisations respectent de manière appropriée les droits d'auteur" - Oui, mon travail porte sur des documents en dehors des restrictions du droit d'auteur (je suis historien,
Jason
2
@ahockley: une autre raison de ne pas scanner est que cela prend très longtemps. Avec un reflex numérique, je peux faire environ 20 pages par minute sur une table, mais un scanner qui utilise rapidement un chargeur de documents et coûte cher.

Réponses:

7

Si votre appareil photo a un mode noir et blanc, j'essaierais de réduire votre temps de post-traitement. De plus, de nombreux programmes d'OCR avec lesquels j'ai travaillé font beaucoup mieux en noir et blanc.

Vous voudrez être aussi parallèle à la page que possible, car pour réduire le bougé de l'appareil photo lorsque vous tenez la main, vous aurez probablement besoin de votre ouverture la plus large afin de maximiser votre vitesse d'obturation. Le petit capteur de votre s95 devrait augmenter votre DOF suffisamment pour que j'ouvre l'ouverture aussi large que possible.

Étant donné que vous allez simplement exécuter cela via l'OCR, augmentez votre ISO jusqu'à ce qui vous donne une exposition correcte avec un minimum de secousses. L'OCR est beaucoup moins susceptible de se plaindre du bruit supplémentaire que les lettres floues.

La balance des blancs, si vous ne faites que parler de texte, devrait être adaptée à votre réglage "intérieur" pour votre appareil photo - mais franchement, ne vous en faites pas trop.

Vos mégapixels peuvent n'importer que si le texte de votre document est incroyablement petit et que vous devrez clairement résoudre ce niveau de détail, mais je suppose que 6-7 conviendra à la plupart des choses.

rfusca
la source
1
Vous voulez probablement dire "perpendiculaire à la page". Si vous êtes parallèle, il sera difficile de lire le texte. ;-)
Craig Walker
@Craig Walker - il a utilisé les termes "parallèle" à la page et j'ai compris ce qu'il voulait dire, donc je n'essayais pas de le confondre. Sans oublier que le capteur lui-même serait parallèle, tout comme le viseur. Cela dépend simplement de la partie de la caméra que vous référencez. Le terme était intentionnel.
rfusca
Utilisez le plus de mégapixels possible, les documents OCR sont ce qui compte et ils seront relativement minuscules et tant que la source sera entièrement en texte, non affectée par la résolution de la caméra de toute façon. J'utilise Abbyy FineReader et cela fonctionne mieux sur des images de plus haute résolution (21MP au lieu de 10MP, par exemple). Alors tirez à 10MP.
C'est suffisant.
Craig Walker
+1 pour le mode N / B. RVB pour le traitement de texte gaspille des pixels.
Greg
2

Vous semblez déjà avoir une bonne compréhension des paramètres. Le bougé de l'appareil photo va ruiner la lisibilité du texte plus que toute autre chose, donc j'optimiserais cela en premier. Si vous ne pouvez pas utiliser un trépied, assurez-vous que votre vitesse d'obturation est d'au moins 1 sur votre distance focale (équivalent 35 mm). Un zoom arrière facilitera les choses. Utilisez la stabilisation d'image si vous l'avez.

L'ouverture peut être assez large, assurez-vous simplement que vous êtes parallèle à la page. Une grande ouverture aidera à la vitesse d'obturation, encore une fois le flou dû à une grande ouverture n'est rien comparé au flou dû au mouvement de l'appareil photo!

ISO, tout ce dont vous avez besoin pour obtenir une bonne exposition. Le bruit ne devrait pas affecter la lisibilité tant qu'il n'est pas vraiment mauvais.

La prise de vue d'une balance des blancs personnalisée basée sur le papier lui-même serait préférable, mais le logiciel OCR devrait être capable de gérer un fond blanc cassé.

Matt Grum
la source
1
  1. Je suppose que vous convertissez des JPEG en PDF. Je recommande de capturer le maximum et d'utiliser un programme pour réduire la taille au 6-7 MP avec une netteté appliquée après la réduction et avant la conversion au format PDF.

  2. Pour clarifier, vous voulez une ouverture plus étroite pour une plus grande profondeur de champ, qui est un nombre f-stop plus élevé. (par exemple, vous voulez f / 8 au lieu de f / 2). Avec du texte pour plus de lisibilité, essayez de pointer la caméra aussi perpendiculairement que possible afin de ne pas avoir à vous soucier de la profondeur de champ. C'est une bonne idée d'arrêter un peu de grand ouvert pour réduire les aberrations telles que CA que vous verrez avec du texte noir sur blanc. Plus vous êtes proche du papier, plus la profondeur de champ sera faible.

  3. Cela aura probablement le plus grand effet sur la lisibilité si vous tenez la main. Si vous tenez la main, vous souhaitez sélectionner une vitesse d'obturation telle qu'elle soit plus rapide que 1 / (focale équivalente de 35 mm), voire plus rapide. Cela dépend du paramètre de zoom que vous utilisez sur votre P&S. Si vous utilisez l'extrémité large, vous pouvez vous en sortir avec des vitesses d'obturation plus longues, mais vous pouvez obtenir une distorsion en barillet. Si vous photographiez des documents texte et non un écran d'ordinateur, je vous recommande d'essayer un flash.

    Si vous le pouvez, soulevez le document (scotché ou quelque chose de sorte qu'il soit plat) afin de pouvoir reposer l'appareil photo sur quelque chose et obtenir la vitesse d'obturation aussi longue que vous le souhaitez. Vous pouvez également utiliser un pouf ou de petits objets pour incliner l'appareil photo pendant qu'il repose. En outre, vous pouvez obtenir des adaptateurs de trépied de bouteille d'eau pour un P&S.

  4. L'ouverture, la vitesse d'obturation et l'ISO forment un triangle d'exposition. Lisez à ce sujet ici . Plus l'ISO est élevé, plus l'ouverture est étroite et la vitesse d'obturation plus courte que vous pouvez utiliser, mais l'image sera plus bruyante. Je recommande une faible ISO (400 ou moins) pour un P&S avec du texte.

  5. Sélectionnez la balance des blancs pour votre situation d'éclairage. Si vous avez un fluorescent, utilisez-le. Si vous utilisez le flash, utilisez la balance des blancs du flash.

Eruditass
la source
Je ne pense pas que f / 8 soit réaliste pour la prise de vue à main levée à l'intérieur (sauf si vous utilisez le flash, vous devrez d'abord demander la permission à la bibliothèque), plus f / 8 va causer de la distraction avec un petit capteur, le gain de netteté est minime par rapport à l'augmentation requise du temps d'obturation / ISO.
Matt Grum
@Matt f / 8 est un exemple pour montrer qu'il veut un nombre plus élevé pour augmenter la profondeur de champ (et réduire d'autres aberrations telles que CA, qui peuvent être visibles). Je ne lui ai pas donné de directives car je ne sais pas combien de lumière il a. Distraction? Vous voulez dire la diffraction?
Eruditass
Oui, je voulais dire diffraction - j'écris ceci sur mon téléphone qui a la fâcheuse habitude de corriger automatiquement mes mots même lorsque je les épelle correctement. CA ne sera pas un problème majeur (par rapport au bougé de l'appareil photo), je pense que vous feriez mieux de vous arrêter en grand ouvert, si la lumière est un gros problème ...
Matt Grum
N'aimez-vous pas la technologie? Ouais, je dirais qu'un arrêt à partir d'une grande ouverture est une bonne ligne directrice et je conviens que le bougé de l'appareil photo serait le point crucial.
Eruditass
C'est une très bonne suggestion de filmer avec un maximum de MP, puis de sous-échantillonner sur l'ordinateur. Je peux imaginer que la netteté + un contraste supplémentaire conduira à un texte beaucoup plus net, plus facile à lire.
Jason
1

Je suis d'accord avec les suggestions de prise de vue dans la plus haute résolution disponible et de réduire la taille de l'ordinateur. Choisissez également le jpeg de la plus haute qualité que vous pouvez obtenir de votre appareil photo, ou même prenez des photos brutes si votre appareil photo le permet, et convertissez-les en tiff ou png. La compression avec perte en jpeg peut créer des artefacts autour de la frontière encre / papier qui pourraient confondre votre logiciel ocr.

En général, ce que vous voulez faire, c'est utiliser des paramètres qui obtiendront l'image la plus nette possible. Des choses comme le contraste, la balance des blancs, etc. peuvent toutes être modifiées dans l'ordinateur. En fait, augmenter le contraste à l'aide de l'outil Niveaux ou de l'outil Contraste / Luminosité dans Photoshop ou GIMP pourrait vous aider beaucoup.

De plus, la conversion au format en niveaux de gris réduira considérablement la taille de vos fichiers. Et si vous faites cela et augmentez le contraste, vous n'avez pas vraiment à vous soucier de la balance des blancs. Vous pouvez expérimenter la balance des blancs, cependant, certains paramètres peuvent produire un meilleur contraste que d'autres (cela dépend de votre éclairage).

Si votre ordinateur peut le gérer, effectuez tous les réglages (niveaux de gris, contraste, luminosité) avant de réduire la taille et après la réduction, appliquez un filtre de netteté à l'image.

Jan Hlavacek
la source
1

Quelques réflexions, que je n'ai pas remarquées ailleurs, à ajouter au mix:

  • Si vous photographiez "zoom avant" (plus de téléobjectif ), cela vous amènera à tirer plus loin de la page, ce qui vous donnera alors une image plus cohérente par rapport à la taille du texte (les mots dans un coin seront plus proches de la même taille que les mots du milieu; avec le grand angle, vous pourriez obtenir une distorsion par rapport à cela). Je ne sais pas quel est le paramètre «idéal», ici, et c'est un compromis contre les vitesses d'obturation requises, potentiellement, juste quelque chose à penser.

  • Vous voudrez " surexposer " par rapport à ce que votre appareil photo pense probablement être juste par défaut (à moins qu'il ne soit assez intelligent pour deviner qu'il s'agit de papier - je le mets entre guillemets parce que vous ne voulez pas vraiment le surexposer) , juste surexposer en fonction de la mesure sur une page blanche), car la tonalité principale (le papier lui-même) sera la principale raison pour laquelle l'appareil photo essayera d'exposer, et si vous exposez le papier en gris moyen, vous aurez un point de départ plus boueux. Si vous "surexposez" par un arrêt et demi à 2 arrêts (il suffit de ne pas aller jusqu'au point d'écrêtage), le texte doit toujours être agréable et sombre, mais le papier sera agréable et lumineux, créant des séparations de contraste ( et donc OCR) plus facile.

  • essayez d'avoir un éclairage uniforme - si un coin de la page est beaucoup plus clair ou plus sombre qu'un autre, cela rendra plus difficile la séparation des éléments dans le noir pur et le blanc pur que vous souhaitez probablement à des fins d'OCR.

  • un "stand de copie" est idéal pour des projets comme celui-ci, bien que je présume au-delà de ce que vous pourriez facilement avoir dans la bibliothèque ... Cependant, selon la façon dont votre bibliothèque est configurée, il est possible qu'il y ait quelque part (peut-être une étagère sur le bureau, ou une tige qui détient un éclairage ou similaire?) que vous pourriez placer une super pince avec une rotule (en voici une , mais toute super pince avec un "goujon" de taille appropriée (selon la tête) et une sorte de trépied tête ferait l'affaire), et votre appareil photo peut alors être monté sur la surface du bureau (ou autre), de sorte que vous puissiez avoir un positionnement cohérent et une stabilité au cas où vous auriez besoin d'une exposition plus longue. Fondamentalement, cela équivaudrait à un stand de copie "du pauvre".

    Vous pouvez également utiliser un retardateur court ou une télécommande (j'imagine que votre appareil photo dispose d'un mode retardateur de 2 secondes, et peut-être un mode personnalisé qui pourrait être encore plus court), pour éviter que l'appareil ne bouge en appuyant sur le bouton.

C'est tout ce à quoi je pense pour le moment. J'espère que c'est utile.

lindes
la source
1

J'ai le même travail que toi photo de landman et je l'ai fait pendant des années et des années. La plupart des gens ne savent pas de quoi ils parlent, croyez-moi !!!

  1. L'appareil photo sur M ou manuel

  2. Iso 100-200 le plus élevé le # le plus brillant mais il obtient plus de grain ou de bruit dans l'image

  3. Vitesse d'obturation 1/100 à 1/160 (généralement 1/125 est le meilleur, plus la luminosité est faible, mais vous obtenez plus d'enterrements ou de reprises)

  4. Ouverture ou f2.7 (pourquoi auriez-vous besoin d'un champ de vision profond c'est une page plate)

  5. Prenez des photos en couleur, de 6 à 10 mégapixels, examinez vos paramètres de balance des blancs, généralement fluorescents 1 ou 2, désactivez la plupart des cloches et sifflez si vous n'êtes pas sûr de les désactiver

  6. exposer des photos sur maquette en utilisant acdc

Spencer
la source
0

Quelques petites suggestions, mais je pense que votre configuration semble bonne

  1. Utilisez un trépied. Cela supprimera tous les problèmes de bougé de l'appareil photo et vous permettra d'utiliser une exposition aussi longue que nécessaire.

  2. Évitez que la lumière tombe directement sur le papier à un angle qui peut se refléter directement dans l'objectif et créer un reflet là où vous n'en voulez pas. Cela signifie généralement s'assurer que la lumière provient des côtés.

  3. ISO: En règle générale, vous devriez vous tromper vers une valeur inférieure, mais je suis sûr que toute différence matérielle deviendra rapidement évidente.

En dehors de cela, je ne vois pas de moyens d'améliorer votre configuration. Pour être honnête, je pense que vous l'avez.

AJ Finch
la source
Pouvez-vous suggérer un bon trépied (et relativement peu coûteux) qui serait utile et me permettrait de retourner l'appareil photo pour qu'il soit parallèle aux pages que je photographie? J'ai regardé les trépieds Joby et ils ont l'air prometteurs, mais j'ai entendu dire qu'ils bougent souvent lorsque vous appuyez sur le déclencheur.
Jason
@Jason, juste point. J'ai un Joby, que j'aime, mais pour l'empêcher de bouger lorsque vous appuyez sur l'obturateur, utilisez simplement un déclencheur à distance ou utilisez le retardateur. C'est en fait un bon conseil pour chaque fois que vous utilisez une vitesse d'obturation lente. La mauvaise nouvelle est que tout trépied suffisamment lourd pour être très stable ne sera pas bon marché. Désolé pour ça! (Si vous découvrez différemment, faites le moi savoir!);)
AJ Finch
0

Il semble que vous ayez déjà la plupart des réponses :-P Je vais juste ajouter quelques commentaires sur vos points:

  1. Résolution: vous avez raison, vous n'aurez pas besoin de beaucoup de résolution ici, surtout si vous allez simplement visualiser les images à l'écran. Je le plafonnerais probablement à deux fois la résolution d'écran maximale typique moi-même.

  2. Ouverture: vous avez raison de sélectionner une ouverture plus petite pour obtenir un peu de marge de manœuvre en profondeur de champ. Cependant, vous n'aurez probablement pas besoin de beaucoup. Jouez avec la calculatrice de profondeur de champ pour votre distance focale, déterminez un DOF raisonnable, puis optez pour la plus grande ouverture possible. (Cependant, assurez-vous que vous êtes un arrêt ou deux sous votre ouverture maximale pour une meilleure netteté.) Vous voulez la plus grande ouverture afin d'avoir plus d'espace pour jouer avec l'obturateur et l'ISO; voir ci-dessous.

  3. Obturateur: vous souhaitez évidemment que cela soit aussi rapide que possible pour réduire les tremblements, tout en obtenant suffisamment de lumière. J'ai entendu diverses sources affirmer que la "vitesse d'obturation était égale à la distance focale" pour éviter les tremblements; certains réclament le double. Donc, si vous utilisez un objectif 50 mm, essayez de maintenir la vitesse d'obturation entre 1/50 et 1/100. Une fois que vous avez cela, essayez la vitesse la plus lente pour maximiser la lumière.

  4. ISO: vous devriez pouvoir augmenter ce niveau assez haut. Le bruit pourrait réduire l'apparence de l'image mais ne dégradera probablement pas trop sa lisibilité. Ce qui est «ISO élevé» et «trop bruyant» dépend de votre appareil photo. Expérience. C'est probablement la meilleure façon pour vous d'obtenir votre exposition correcte en basse lumière, par rapport à l'ouverture et à l'obturateur.

  5. Balance des blancs: pour vous, cela ne devrait pas trop d'importance. Si votre papier photographié sort blanc cassé, est-ce important? (Histoire différente si vous photographiez des livres avec des images en couleur bien sûr). Si vous souhaitez le corriger en post, vous aurez un temps relativement facile, car vous avez beaucoup de papier de couleur neutre avec lequel travailler. Je laisserais probablement votre appareil photo sur la balance des blancs automatique et l'oublierais.

Craig Walker
la source