Je reçois parfois des fichiers de mes clients dont l'extension de fichier est incorrecte. Par exemple, le nom est image.jpg
mais le fichier est en réalité une image TIFF. Dans de nombreux cas, je peux le clarifier en ouvrant le fichier dans un éditeur de texte, en regardant les quelques premiers octets, puis en déduisant le type de fichier dont il s’agit.
Cela fonctionne pour moi avec les fichiers JPEG, TIFF, GIF et PDF. Cependant, il existe beaucoup plus de types de fichiers.
Est-il possible d'automatiser l'identification du type de fichier correct en analysant les données contenues?
file
commande le fait sur les machines * nix.windows
, mais le commentaire implique: "Vous ne pouvez pas le faire sous Windows, vous devez utiliser * nix à la place". Alors? Le commentaire est dirigé "pour ceux qui sont intéressés". En quoi? Changer d'ordinateur?:(
Réponses:
Vous pouvez utiliser l' outil TrID , qui possède une bibliothèque croissante de définitions de types de fichiers pour identifier les fichiers avec.
Les caractères génériques sont pris en charge. Ainsi, dans votre exemple, vous pouvez simplement placer toutes les images à examiner dans un dossier, par exemple C: \ verifyimages. Vous pouvez ensuite utiliser la commande suivante:
Cela examinera tous les fichiers du
verifyimages
dossier.Il existe également une version graphique disponible, TrIDNet :
Il existe une documentation sur la manière d'intégrer facilement TrID ou TrIDNet dans Windows Explorer et Total Commander:
Windows Explorer
Commandant Total
la source
fichier
la source
file
est standard, mais sur des systèmes plus anciens (en particulier non-Linux) pas très compétents. Pour Ubuntu, etc., il devrait être assez respectable et même installé en standard.file
Windows. Si d'autres commandes * nix vous intéressent en tant qu'utilisateur Windows, explorez ce site pour trouver toutes sortes de gemmes.file
soit un expert des fichiers créés par les applications Windows.file
ce soit, et pourtant vous avez presque décidé de son efficacité.Auparavant, je travaillais à la Bibliothèque nationale de France pour créer un système d'archivage numérique contenant non seulement des livres numérisés, mais aussi des millions d'artefacts numériques contenant toutes sortes de types de fichiers étranges. Nous avons utilisé JHOVE pour reconnaître les formats de fichiers.
JHOVE est une source ouverte, elle est gérée par JSTOR et la bibliothèque de l’Université de Harvard. C'est assez simple à utiliser .
la source
J'utilise les bibliothèques OutsideIn d'Oracle dans mes programmes. Pas gratuit, mais ils fonctionnent bien, surtout pour les images. Le marché dit qu'il prend en charge plus de 500 types de fichiers.
la source
Vous pouvez vérifier le type de fichier à partir de n’importe quel ordinateur, y compris Windows, à l’adresse suivante:
http://www.checkfiletype.com
la source