Quels sites Web exposent les numéros de série du boîtier de l'appareil photo à partir de l'image d'origine EXIF?
Flickr est un site de partage de photos qui expose de nombreuses métadonnées de photos (à partir des données EXIF ) et rend même l'accès facile grâce à l' API Flickr . Picasaweb de Google propose également certaines informations de l'EXIF mais pas le numéro de série.
Y a-t-il d'autres sites qui pourraient m'aider?
Pour vous donner un aperçu de ce que je fais, j'essaie de rassembler une base de données des numéros de série des caméras et les URL des images où ils ont été trouvés. C'est juste moi qui fais quelque chose gratuitement dans l'espoir que nous pourrons attraper certaines des personnes qui volent nos précieuses caméras! J'espère que ce n'est pas trop hors sujet car je n'essaye pas de vendre quoi que ce soit, j'essaie juste de faire du bien!
Avertissement: je suis l'auteur de stolencamerafinder ;)
Mise à jour - Comme demandé par fbuchinger, voici une mise à jour rapide de l'état du projet:
De nombreux sites (dont Facebook malheureusement) retirent les makernotes de l'EXIF. Jusqu'à présent, j'ai trouvé que Flickr est la source la plus riche de numéros de série. Je suppose que c'est parce que les gens téléchargent souvent des images en taille réelle (lire "non éditées"). Sur mon site ( stolencamerafinder.com ), je propose une application Java Webstart qui récolte les données Flickr via son API. Puisqu'il y a un plafond sur la vitesse à laquelle je fais des appels API, je l'ai écrit pour que le travail soit partagé entre le nombre de clients de démarrage Web, réduisant ainsi la bande passante et le processeur sur les clients plus il y a de personnes qui l'exécutent. Si vous lisez ceci et que vous avez, disons, un accès administrateur à un serveur au travail qui ne fait pas grand-chose, pourquoi ne pas le laisser fonctionner là-bas;)
J'ai également écrit un plugin Google Chrome qui ne fait que surveiller les images sur des sites Web avec un numéro de série intégré. Je ne m'attends pas à un rendement très élevé de cette application, l'idée principale était de découvrir quels sites Web peuvent être de bonnes sources pour écrire des outils d'araignée sur mesure, puis de les explorer.
J'ai fait connaître mon API pour stolencamerafinder et je recherche d'autres programmeurs pour m'aider à écrire des programmes pouvant servir de robots d'exploration.
J'ai collecté beaucoup de données intéressantes dans le cadre de ce projet que je mettrai bientôt sur le site Web, telles que les modèles d'appareils photo qui écrivent et n'écrivent pas de numéros de série utiles. Le Nikon D50 par exemple écrit simplement "D50" comme son numéro de série!
Je serais extrêmement reconnaissant pour tout commentaire (bon ou mauvais!) Que vous pourriez avoir sur mon projet.
-Mat
Réponses:
J'adore l'idée d'un voleur-receveur. ;)
J'ai remarqué que DeviantArt.com semble "capturer" toutes les métadonnées EXIF qui sont incorporées dans toutes les images téléchargées. Il ne montre pas tout, mais il y a certaines parties du site (beaucoup d'entre elles uniquement pour les membres payants) qui montrent des informations plus détaillées sur une image téléchargée, et j'ai vu des données de balises complètes répertoriées.
Je suppose, techniquement parlant, si vous pouviez faire quelque chose de similaire à TinEye.com (Reverse Image Search) qui indexe les images et les recherches par similitude de contenu. TinEye est pratique car il fait correspondre les images par leur contenu, mais il a ses limites. Les photomanipulations créées avec une photo protégée par le droit d'auteur sont difficiles à identifier. La recherche par numéro de série fournirait une approche alternative et complémentaire.
Vous pouvez techniquement obtenir toutes les données exif qui sont intégrées dans les images téléchargées sur Internet. Si le numéro de série de la caméra est intégré, vous aurez ce que vous cherchez. Vous devrez gratter une copie de chaque image des sites que vous indexez, extraire tout EXIF (ou autres données de balise) des images indexées et suivre les informations avec un lien vers la source. Vous pourriez probablement également utiliser les principaux moteurs de recherche comme Bing et Google pour trouver des images à indexer (des recherches de base par mot-clé, telles que les noms de photographes, les lieux, etc. pourraient être suffisantes.) Vous n'auriez probablement pas besoin de conserver l'image (et cela pourrait impliquer des problèmes juridiques de toute façon), mais au moins vous auriez un index des données de balise EXIF / IPTC, éventuellement un numéro de série et un lien source.
la source
MISE À JOUR:
Merci pour la mise à jour de l'état du projet! Tout d'abord, l'approche avec l'application Java Webstart est intéressante - utilisez-vous différentes clés API Flickr pour chaque instance Webstart ou Flickr limite-t-il les demandes API en fonction d'une combinaison clé API / adresse IP?
J'ai exécuté votre application WebStart et elle a donné 0 numéros de série après avoir numérisé 50 photos. Je n'ai pas regardé votre code source, mais vous devez savoir que seule une infime minorité de caméras (principalement des reflex numériques) écrivent des numéros de série dans les métadonnées exif.
Je recommande de télécharger les exemples d'images à partir du référentiel d'informations Meta de Phil Harvey et d'exécuter exiftool dessus pour voir quels modèles fournissent réellement des numéros de série. Vous pouvez ensuite affiner la recherche de votre application Webstart à ces modèles et ainsi améliorer considérablement le taux de réussite.
Je suis tombé sur votre question lorsque j'ai commencé à explorer photo.stackexchange.com.
Il y a 2 ans, j'ai eu une idée très similaire à stolencamerafinder et j'ai commencé à l'implémenter en python. Cependant, je l'ai arrêté pour diverses raisons:
La plupart des numéros de série des caméras stockés dans les données EXIF sont modifiables et donc fausses (au moins avec exiftool) -> risque de fausses alertes ou de "spam de numéro de série" (au moins lorsque le service commence à devenir populaire)
La plupart des gens utilisent des téléchargeurs d'images qui redimensionnent leurs images et éliminent ainsi souvent tout ou partie des données EXIF (rappelez-vous que le numéro de série est toujours stocké dans un makernote propriétaire exif qui est souvent supprimé lors des conversions d'images) -> faible rapport d'images inspectées : numéros de série extraits.
mais je suis curieux de savoir comment votre projet a évolué ... pourriez-vous donner un bref résumé de l'état?
la source
Comme ma première réponse est plus axée sur les détails techniques, j'ai décidé d'ouvrir une deuxième réponse pour vous donner un aperçu de mon idée originale de "camerafinder" baptisée "CATT" (Camera Anti Theft Tool). N'hésitez pas à utiliser mes idées, mais croyez-moi bien s'il vous plaît ...
Contrairement à stolencamerafinder, CATT fonctionne sur une base opt-in. En tant que propriétaire d'une caméra, vous vous inscrivez sur le site CATT, créez un profil utilisateur, puis enregistrez vos caméras.
Pour ce faire, vous devez prendre une photo de certains QRCode générés aléatoirement affichés à l'écran. Ensuite, vous téléchargez la photo non modifiée sur le site CATT. Une fois le téléchargement terminé, le serveur lit les métadonnées de la photo et recherche un numéro de série intégré. Il essaie également de décoder le QRCode de l'image et le compare à un hachage stocké. C'est pour empêcher que quelqu'un puisse enregistrer votre appareil photo en téléchargeant simplement une photo arbitraire prise avec cet appareil photo.
Lorsque votre caméra est volée, vous vous connectez sur le site CATT et marquez cet appareil comme volé. Pour retracer les caméras volées, nous avons prévu un analyseur de numéro de série exif côté client en javascript comme script mozilla greasemonkey (similaire à votre extension chrome). Il ne devrait s'exécuter que sur des pages flickr contenant des images originales (grâce au support du modèle d'url de greasemonkey) afin de ne pas trop ralentir le navigateur. Le script contacterait régulièrement le serveur CATT pour récupérer une liste des séries de caméras volées. Si la série de l'image actuellement affichée montre une correspondance, elle affichera une alerte.
J'ai vu que votre extension chrome suit une approche similaire (bien qu'elle semble simplement collecter les publications en série). Dans votre cas, je tirerais parti de l'extension avec le fichier W3C Api (actuellement Firefox et Chrome), afin que l'utilisateur puisse également inspecter les photos stockées localement et pas seulement celles intégrées dans les pages Web. Cela augmentera sûrement votre "récolte de numéros de série", car aucun "homme du milieu" (facebook flickr, etc.) ne supprimera les données exif.
Voici une démonstration intéressante de Mozilla sur l'Exif Extraction avec l'API de fichier W3C .
la source