Quels sites Web de partage de photos exposent les numéros de série des caméras?

26

Quels sites Web exposent les numéros de série du boîtier de l'appareil photo à partir de l'image d'origine EXIF?

Flickr est un site de partage de photos qui expose de nombreuses métadonnées de photos (à partir des données EXIF ) et rend même l'accès facile grâce à l' API Flickr . Picasaweb de Google propose également certaines informations de l'EXIF mais pas le numéro de série.

Y a-t-il d'autres sites qui pourraient m'aider?

Pour vous donner un aperçu de ce que je fais, j'essaie de rassembler une base de données des numéros de série des caméras et les URL des images où ils ont été trouvés. C'est juste moi qui fais quelque chose gratuitement dans l'espoir que nous pourrons attraper certaines des personnes qui volent nos précieuses caméras! J'espère que ce n'est pas trop hors sujet car je n'essaye pas de vendre quoi que ce soit, j'essaie juste de faire du bien!

Avertissement: je suis l'auteur de stolencamerafinder ;)


Mise à jour - Comme demandé par fbuchinger, voici une mise à jour rapide de l'état du projet:

De nombreux sites (dont Facebook malheureusement) retirent les makernotes de l'EXIF. Jusqu'à présent, j'ai trouvé que Flickr est la source la plus riche de numéros de série. Je suppose que c'est parce que les gens téléchargent souvent des images en taille réelle (lire "non éditées"). Sur mon site ( stolencamerafinder.com ), je propose une application Java Webstart qui récolte les données Flickr via son API. Puisqu'il y a un plafond sur la vitesse à laquelle je fais des appels API, je l'ai écrit pour que le travail soit partagé entre le nombre de clients de démarrage Web, réduisant ainsi la bande passante et le processeur sur les clients plus il y a de personnes qui l'exécutent. Si vous lisez ceci et que vous avez, disons, un accès administrateur à un serveur au travail qui ne fait pas grand-chose, pourquoi ne pas le laisser fonctionner là-bas;)

J'ai également écrit un plugin Google Chrome qui ne fait que surveiller les images sur des sites Web avec un numéro de série intégré. Je ne m'attends pas à un rendement très élevé de cette application, l'idée principale était de découvrir quels sites Web peuvent être de bonnes sources pour écrire des outils d'araignée sur mesure, puis de les explorer.

J'ai fait connaître mon API pour stolencamerafinder et je recherche d'autres programmeurs pour m'aider à écrire des programmes pouvant servir de robots d'exploration.

J'ai collecté beaucoup de données intéressantes dans le cadre de ce projet que je mettrai bientôt sur le site Web, telles que les modèles d'appareils photo qui écrivent et n'écrivent pas de numéros de série utiles. Le Nikon D50 par exemple écrit simplement "D50" comme son numéro de série!

Je serais extrêmement reconnaissant pour tout commentaire (bon ou mauvais!) Que vous pourriez avoir sur mon projet.

-Mat

brûlures mates
la source
8
Il serait peut-être plus utile et plus commercialisable d'offrir un service pour suivre où «vos» photos ont été (ré) utilisées, potentiellement sans licence.
Rowland Shaw
j'ai mis à jour ma réponse
fbuchinger

Réponses:

6

J'adore l'idée d'un voleur-receveur. ;)

J'ai remarqué que DeviantArt.com semble "capturer" toutes les métadonnées EXIF ​​qui sont incorporées dans toutes les images téléchargées. Il ne montre pas tout, mais il y a certaines parties du site (beaucoup d'entre elles uniquement pour les membres payants) qui montrent des informations plus détaillées sur une image téléchargée, et j'ai vu des données de balises complètes répertoriées.

Je suppose, techniquement parlant, si vous pouviez faire quelque chose de similaire à TinEye.com (Reverse Image Search) qui indexe les images et les recherches par similitude de contenu. TinEye est pratique car il fait correspondre les images par leur contenu, mais il a ses limites. Les photomanipulations créées avec une photo protégée par le droit d'auteur sont difficiles à identifier. La recherche par numéro de série fournirait une approche alternative et complémentaire.

Vous pouvez techniquement obtenir toutes les données exif qui sont intégrées dans les images téléchargées sur Internet. Si le numéro de série de la caméra est intégré, vous aurez ce que vous cherchez. Vous devrez gratter une copie de chaque image des sites que vous indexez, extraire tout EXIF ​​(ou autres données de balise) des images indexées et suivre les informations avec un lien vers la source. Vous pourriez probablement également utiliser les principaux moteurs de recherche comme Bing et Google pour trouver des images à indexer (des recherches de base par mot-clé, telles que les noms de photographes, les lieux, etc. pourraient être suffisantes.) Vous n'auriez probablement pas besoin de conserver l'image (et cela pourrait impliquer des problèmes juridiques de toute façon), mais au moins vous auriez un index des données de balise EXIF ​​/ IPTC, éventuellement un numéro de série et un lien source.

jrista
la source
1
Un inconvénient est que si la photo est manipulée de quelque manière que ce soit, l'EXIF est très probablement supprimé ou réduit. La disponibilité des données EXIF ​​sur un site de partage de photos et les recherches d'images générales dépendent entièrement du méta-contenu de l'image téléchargée. Pourtant, rechercher la possibilité d'une méta qui peut être utilisée pour rechercher un appareil photo volé est une bonne idée en soi.
nik
@nik: C'est vrai, vous seriez à la merci de tout ce qui est téléchargé ... C'est dommage que les workflows dans la plupart des outils, comme Photoshop, Lightroom, etc. ne conservent pas les données de balises lors des sauvegardes et des modifications.
jrista
Merci d'avoir souligné Tineye. Ils représentent jusqu'à 1,6 milliard d'images, ce qui fait que mes 0,3 million sont plutôt des ordures! Mais s'ils peuvent le faire, moi aussi! Je vais travailler sur l'écriture d'un robot d'exploration plus générique pour explorer tous les sites Web ...
matt burns
@matt: Certes, ils en ont 1,6 milliard, mais ils ne recherchent pas par numéro de série. Si vous pouviez rechercher à la fois par contenu et par numéro de série, vous auriez un avantage sur eux. ; P
jrista
Notez que sur de nombreux sites, vous ne pouvez pas accéder au fichier d'origine à moins d'avoir un statut d'appartenance ou une connexion à l'utilisateur qui l'a téléchargé. Ainsi, vous ne pourrez peut-être télécharger qu'une version réduite qui a le plus souvent le format EXIF ​​rayé. Les outils de téléchargement le font parfois aussi, en envoyant le fichier avec uniquement des informations de copyright. Subnote: Facebook dépouille tout cela, même les droits d'auteur d'EXIF et a obtenu beaucoup de chaleur des photographes pour cela.
Itai
6

MISE À JOUR:

Merci pour la mise à jour de l'état du projet! Tout d'abord, l'approche avec l'application Java Webstart est intéressante - utilisez-vous différentes clés API Flickr pour chaque instance Webstart ou Flickr limite-t-il les demandes API en fonction d'une combinaison clé API / adresse IP?

J'ai exécuté votre application WebStart et elle a donné 0 numéros de série après avoir numérisé 50 photos. Je n'ai pas regardé votre code source, mais vous devez savoir que seule une infime minorité de caméras (principalement des reflex numériques) écrivent des numéros de série dans les métadonnées exif.

Je recommande de télécharger les exemples d'images à partir du référentiel d'informations Meta de Phil Harvey et d'exécuter exiftool dessus pour voir quels modèles fournissent réellement des numéros de série. Vous pouvez ensuite affiner la recherche de votre application Webstart à ces modèles et ainsi améliorer considérablement le taux de réussite.


Je suis tombé sur votre question lorsque j'ai commencé à explorer photo.stackexchange.com.

Il y a 2 ans, j'ai eu une idée très similaire à stolencamerafinder et j'ai commencé à l'implémenter en python. Cependant, je l'ai arrêté pour diverses raisons:

  • La plupart des numéros de série des caméras stockés dans les données EXIF ​​sont modifiables et donc fausses (au moins avec exiftool) -> risque de fausses alertes ou de "spam de numéro de série" (au moins lorsque le service commence à devenir populaire)

  • La plupart des gens utilisent des téléchargeurs d'images qui redimensionnent leurs images et éliminent ainsi souvent tout ou partie des données EXIF ​​(rappelez-vous que le numéro de série est toujours stocké dans un makernote propriétaire exif qui est souvent supprimé lors des conversions d'images) -> faible rapport d'images inspectées : numéros de série extraits.

mais je suis curieux de savoir comment votre projet a évolué ... pourriez-vous donner un bref résumé de l'état?

fbuchinger
la source
Salut. Je viens d'ajouter une mise à jour dans la question principale ci-dessus. Si vous avez des questions / suggestions, j'aimerais les entendre. -Matt
mat brûle le
J'utilise une seule clé API, mais chaque instance de démarrage Web communique via le site Web pour équilibrer la charge de travail afin que le quota ne soit pas dépassé.
matt burns
Je me demande pourquoi l'application Webstart n'a pas fonctionné pour vous. Il devrait trouver des publications en série dans environ 1/4 de toutes les photos numérisées. Y a-t-il des messages dans les journaux de la console java? J'ai téléchargé ces exemples d'images dans leur intégralité et j'ai écrit un script python pour générer des statistiques. Je les publierai en ligne dès que d'autres pourront le trouver intéressant.
matt burns
6

Comme ma première réponse est plus axée sur les détails techniques, j'ai décidé d'ouvrir une deuxième réponse pour vous donner un aperçu de mon idée originale de "camerafinder" baptisée "CATT" (Camera Anti Theft Tool). N'hésitez pas à utiliser mes idées, mais croyez-moi bien s'il vous plaît ...

Contrairement à stolencamerafinder, CATT fonctionne sur une base opt-in. En tant que propriétaire d'une caméra, vous vous inscrivez sur le site CATT, créez un profil utilisateur, puis enregistrez vos caméras.

Pour ce faire, vous devez prendre une photo de certains QRCode générés aléatoirement affichés à l'écran. Ensuite, vous téléchargez la photo non modifiée sur le site CATT. Une fois le téléchargement terminé, le serveur lit les métadonnées de la photo et recherche un numéro de série intégré. Il essaie également de décoder le QRCode de l'image et le compare à un hachage stocké. C'est pour empêcher que quelqu'un puisse enregistrer votre appareil photo en téléchargeant simplement une photo arbitraire prise avec cet appareil photo.

Lorsque votre caméra est volée, vous vous connectez sur le site CATT et marquez cet appareil comme volé. Pour retracer les caméras volées, nous avons prévu un analyseur de numéro de série exif côté client en javascript comme script mozilla greasemonkey (similaire à votre extension chrome). Il ne devrait s'exécuter que sur des pages flickr contenant des images originales (grâce au support du modèle d'url de greasemonkey) afin de ne pas trop ralentir le navigateur. Le script contacterait régulièrement le serveur CATT pour récupérer une liste des séries de caméras volées. Si la série de l'image actuellement affichée montre une correspondance, elle affichera une alerte.

J'ai vu que votre extension chrome suit une approche similaire (bien qu'elle semble simplement collecter les publications en série). Dans votre cas, je tirerais parti de l'extension avec le fichier W3C Api (actuellement Firefox et Chrome), afin que l'utilisateur puisse également inspecter les photos stockées localement et pas seulement celles intégrées dans les pages Web. Cela augmentera sûrement votre "récolte de numéros de série", car aucun "homme du milieu" (facebook flickr, etc.) ne supprimera les données exif.

Voici une démonstration intéressante de Mozilla sur l'Exif Extraction avec l'API de fichier W3C .

fbuchinger
la source
Merci beaucoup pour cela, quelques bonnes informations et idées. Le QRCode est très intelligent. Je ne suis pas sûr de comprendre à quel point l'API File est utile pour moi dans la façon dont vous mentionnez (qui autoriserait l'accès aux fichiers locaux et aurait des images d'une caméra volée), mais c'est exactement ce que je recherche pour écrire un simple outil d'extraction en série pour la page d'accueil de mon site Web. Au lieu de "Entrez votre numéro de série", je peux simplement permettre aux gens de rechercher avec une image qu'ils ont déjà (cela évite également les erreurs). Un autre avantage est que je dois parfois utiliser le numéro de série interne comme identifiant, pas celui sur le boîtier de la caméra.
matt burns
Soit dit en passant, cette page de démonstration ne fonctionnait que pour moi dans Firefox, pas dans Chrome. Je commence également à penser que cette page n'est pas idéale pour discuter de tout cela, mais elle fera l'affaire pour l'instant! ps. Je voyage à travers l'Asie en ce moment, donc ne soyez pas offensé si je prends quelques jours (/ semaines) pour répondre, vos commentaires m'ont été très utiles, merci.
matt burns
la démo exif reader fonctionne dans chrome> 5, l'erreur est causée par une fonction de journalisation non essentielle (vérifiez la console chrome et redéfinissez-la en tant que fonction vide). Bon voyage!
fbuchinger
À propos du cas d'utilisation du fichier local: Je pense que nous voulons dire la même chose - une extraction série js cam pour les fichiers locaux qui fait partie de votre site Web stolencamerafinder, pas nécessairement de l'extension. Il pourrait être utilisé pour déterminer l'état de la caméra sur la base d'un exemple de photo (par exemple, prise lors de l'achat d'une caméra d'occasion pour s'assurer qu'elle n'a pas été volée à quelqu'un d'autre). BTW: avez-vous étendu l'analyseur Exif de Jacob Seidelin par vous-même ou est-ce que l'extraction du numéro de série est son travail?
fbuchinger
J'ai moi-même étendu son analyseur, mais je n'ai réussi à le faire lire que les sections makernote de Canon et Panasonic jusqu'à présent. (ma connaissance du format IFD est au mieux médiocre). Je dois lui donner un crédit approprié pour son travail sur mon site car c'est surtout son travail. Lorsque je serai satisfait de mes modifications, je le lui renverrai en tant que version d'amélioration / alternative possible.
mat brûle du