Obtention de la somme de contrôle MD5 d'un fichier en Java

510

Je cherche à utiliser Java pour obtenir la somme de contrôle MD5 d'un fichier. J'ai été vraiment surpris, mais je n'ai rien trouvé qui montre comment obtenir la somme de contrôle MD5 d'un fichier.

Comment est-il fait?

Jack
la source
Peut - être que cela vous aidera. Vous pouvez également rechercher la spécification, mais cela prendrait plus de temps car c'est compliqué.
waynecolvin
4
Gardez à l'esprit que, selon les recherches récentes, "le MD5 doit être considéré comme cryptographiquement cassé et impropre à une utilisation ultérieure". en.wikipedia.org/wiki/MD5
Zakharia Stanley
80
MD5 n'est plus considéré comme cryptographiquement sécurisé, mais il est toujours suffisant pour valider la cohérence des fichiers et il est plus rapide que SHA.
jiggy
2
@ZakhariaStanley Il s'agit d'une question sur le total de contrôle.
iPherian
L'utilisation canonique des sommes de contrôle MD5 sur les fichiers est d'éviter les remplacements hostiles des fichiers distribués. C'est là que ce n'est pas sûr. Mais dans un scénario où les exploits hostiles ne sont pas un problème, cela convient parfaitement.
Keith Tyler

Réponses:

541

Il existe un décorateur de flux d'entrée java.security.DigestInputStream, afin que vous puissiez calculer le résumé tout en utilisant le flux d'entrée comme vous le feriez normalement, au lieu d'avoir à effectuer un passage supplémentaire sur les données.

MessageDigest md = MessageDigest.getInstance("MD5");
try (InputStream is = Files.newInputStream(Paths.get("file.txt"));
     DigestInputStream dis = new DigestInputStream(is, md)) 
{
  /* Read decorated stream (dis) to EOF as normal... */
}
byte[] digest = md.digest();
erickson
la source
4
Je suis d'accord, façon très élégante de calculer la somme de contrôle à la volée si vous faites déjà quelque chose avec les octets (c'est-à-dire en les lisant à partir d'une connexion HTTP).
Marc Novakowski
2
@AlPhaba Avez-vous déclaré le iscomme un InputStreamou un FileInputStream? Sonne comme vous l'avez utilisé FileInputStream, ce qui provoquerait cette erreur.
erickson
1
@barwnikk Cela fonctionne très bien en Java 8. MethodNotFoundne fait pas exception à Java standard; vous parlez peut-être d'une erreur de compilation? Dans tous les cas, si cela ne fonctionne pas pour vous, c'est un problème de configuration local ou un problème avec un autre code.
erickson
4
@barwnikk Encore une fois, c'est votre problème de configuration local. Il s'agit d'un code Java 7 et Java 8 valide. Si vous êtes coincé avec des outils de 2006, vous devrez vous adapter.
erickson
5
@erickson Vous ne mettez pas à jour l'objet MessageDigest avec le contenu du fichier. Rt? Ce code imprimera toujours un même résumé.
sunil
302

Utilisez DigestUtils de la bibliothèque Apache Commons Codec :

try (InputStream is = Files.newInputStream(Paths.get("file.zip"))) {
    String md5 = org.apache.commons.codec.digest.DigestUtils.md5Hex(is);
}
Leif Gruenwoldt
la source
1
Ne fonctionne pas pour moi dans mon code Android, j'obtiens cette erreur ... java.lang.NoSuchMethodError: org.apache.commons.codec.binary.Hex.encodeHexString at org.apache.commons.codec.digest.DigestUtils.md5Hex (DigestUtils.java:215)
JPM
@JPM Supposez que vous avez déjà téléchargé et mis le commons-codec.jarsur votre chemin de classe ?
Leif Gruenwoldt
oui là-bas et j'ai exporté dans mon projet Android .. Je peux parcourir le code et la classe est là dans les fichiers source ... bizarre, ça doit être un problème avec Eclipse Android.
JPM
1
J'ai eu le même problème, mais il a été résolu par ce code `FileInputStream fis = new FileInputStream (new File (filePath)); octet de données [] = org.apache.commons.codec.digest.DigestUtils.md5 (fis); char md5Chars [] = Hex.encodeHex (données); String md5 = String.valueOf (md5Chars); `
Dmitry_L
1
Agréable! Pour les nouveaux projets, je réfléchis toujours à deux fois avant d'ajouter une nouvelle dépendance, mais pour les projets existants, je n'ai qu'à vérifier si la bibliothèque est déjà là pour l'utiliser. +1
OscarRyz
164

Il y a un exemple à Java-How-to de Real utilisant la classe MessageDigest .

Consultez cette page pour des exemples utilisant CRC32 et SHA-1 également.

import java.io.*;
import java.security.MessageDigest;

public class MD5Checksum {

   public static byte[] createChecksum(String filename) throws Exception {
       InputStream fis =  new FileInputStream(filename);

       byte[] buffer = new byte[1024];
       MessageDigest complete = MessageDigest.getInstance("MD5");
       int numRead;

       do {
           numRead = fis.read(buffer);
           if (numRead > 0) {
               complete.update(buffer, 0, numRead);
           }
       } while (numRead != -1);

       fis.close();
       return complete.digest();
   }

   // see this How-to for a faster way to convert
   // a byte array to a HEX string
   public static String getMD5Checksum(String filename) throws Exception {
       byte[] b = createChecksum(filename);
       String result = "";

       for (int i=0; i < b.length; i++) {
           result += Integer.toString( ( b[i] & 0xff ) + 0x100, 16).substring( 1 );
       }
       return result;
   }

   public static void main(String args[]) {
       try {
           System.out.println(getMD5Checksum("apache-tomcat-5.5.17.exe"));
           // output :
           //  0bb2827c5eacf570b6064e24e0e6653b
           // ref :
           //  http://www.apache.org/dist/
           //          tomcat/tomcat-5/v5.5.17/bin
           //              /apache-tomcat-5.5.17.exe.MD5
           //  0bb2827c5eacf570b6064e24e0e6653b *apache-tomcat-5.5.17.exe
       }
       catch (Exception e) {
           e.printStackTrace();
       }
   }
}
Bill le lézard
la source
70
Ouais ... toujours en ligne après 11 ans! :-)
RealHowTo
L'exemple du Real-Java-How-To fonctionne parfaitement et était simple à mettre en œuvre.
bakoyaro
La boucle de lecture est un peu maladroite. read()ne retournera pas zéro, et un do/whilen'est pas vraiment approprié.
Marquis de Lorne
10
@EJP Merci pour vos commentaires en temps opportun.
Bill the Lizard
octet [] tampon = nouvel octet [1024]; pouvons-nous changer la taille de 1024 à quelque chose de plus optimal?
Jalpesh
90

L' API com.google.common.hash offre:

  • Une API conviviale unifiée pour toutes les fonctions de hachage
  • Implémentations séparables 32 et 128 bits de murmur3
  • Adaptateurs md5 (), sha1 (), sha256 (), sha512 (), modifiez une seule ligne de code pour basculer entre ces derniers et murmurez.
  • goodFastHash (int bits), lorsque vous ne vous souciez pas de l'algorithme que vous utilisez
  • Utilitaires généraux pour les instances HashCode, comme combineOrdered / combineUnordered

Lisez le Guide de l' utilisateur ( IO Explained , Hashage Explained ).

Pour votre cas d'utilisation, Files.hash()calcule et renvoie la valeur de résumé d'un fichier.

Par exemple un calcul du résumé (changez SHA-1 en MD5 pour obtenir le résumé MD5)

HashCode hc = Files.asByteSource(file).hash(Hashing.sha1());
"SHA-1: " + hc.toString();

Notez que est beaucoup plus rapide que , alors utilisez si vous n'avez pas besoin d'une somme de contrôle cryptographiquement sécurisée. Notez également que ne doit pas être utilisé pour stocker des mots de passe et similaires, car il est facile de forcer brutalement, pour l'utilisation des mots de passe , ou au lieu.

Pour une protection à long terme avec des hachages, un schéma de signature Merkle ajoute à la sécurité et le groupe d'étude post-quantique sur la cryptographie parrainé par la Commission européenne a recommandé l'utilisation de cette cryptographie pour une protection à long terme contre les ordinateurs quantiques ( réf .).

Notez que a un taux de collision plus élevé que les autres.

oluies
la source
Quelle partie de Files.hash, comme indiqué ci-dessus, ne couvre pas Files.hash?
oluies
2
Le Files.hash()est marqué comme obsolète, la méthode recommandée est:Files.asByteSource(file).hash(Hashing.sha1())
erkfel
1
Et depuis janvier 2018, il Hashing.sha1()est devenu obsolète. La fonction Hashing.sha256()est recommandée à la place. source
MagicLegend
60

Utilisation de nio2 (Java 7+) et pas de bibliothèques externes:

byte[] b = Files.readAllBytes(Paths.get("/path/to/file"));
byte[] hash = MessageDigest.getInstance("MD5").digest(b);

Pour comparer le résultat avec une somme de contrôle attendue:

String expected = "2252290BC44BEAD16AA1BF89948472E8";
String actual = DatatypeConverter.printHexBinary(hash);
System.out.println(expected.equalsIgnoreCase(actual) ? "MATCH" : "NO MATCH");
assylias
la source
@Arash oui absolument - merci. J'ai mélangé la classe JDK Files et celle de Guava.
assylias
J'aime cette solution plus que celle d'Erickson car elle peut être emballée avec des options pour utiliser une programmation de style purement fonctionnelle
Gabriel Hernandez
2
Pour un gros fichier, cela utilisera beaucoup de mémoire puisque le fichier entier est lu puis alimenté dans le résumé au lieu de lire des morceaux et de les "digérer" au fur et à mesure qu'ils sont lus.
bernie
39

Guava fournit désormais une nouvelle API de hachage cohérente qui est beaucoup plus conviviale que les différentes API de hachage fournies dans le JDK. Voir Explication du hachage . Pour un fichier, vous pouvez obtenir facilement la somme MD5, CRC32 (avec la version 14.0+) ou bien d'autres hachages:

HashCode md5 = Files.hash(file, Hashing.md5());
byte[] md5Bytes = md5.asBytes();
String md5Hex = md5.toString();

HashCode crc32 = Files.hash(file, Hashing.crc32());
int crc32Int = crc32.asInt();

// the Checksum API returns a long, but it's padded with 0s for 32-bit CRC
// this is the value you would get if using that API directly
long checksumResult = crc32.padToLong();
ColinD
la source
32

D'accord. Je devais ajouter. Implémentation d'une ligne pour ceux qui ont déjà une dépendance Spring et Apache Commons ou qui prévoient de l'ajouter:

DigestUtils.md5DigestAsHex(FileUtils.readFileToByteArray(file))

Option pour et Apache commons uniquement (crédit @duleshi):

DigestUtils.md5Hex(FileUtils.readFileToByteArray(file))

J'espère que cela aide quelqu'un.

MickJ
la source
1
C'estDigestUtils.md5Hex(FileUtils.readFileToByteArray(file))
duleshi
La solution basée sur les communs de David Onter est meilleure car elle ne lit pas un fichier entier en mémoire.
Fran Marzoa
Au moins pour Spring 5 vous devez DigestUtils.md5Digest(InputStream inputStream)calculer le résumé MD5 et DigestUtils.md5DigestAsHex(InputStream inputStream)la représentation sous forme de chaîne hexadécimale des méthodes de résumé MD5 sans lire un fichier entier en mémoire.
Mike Shauneu
24

Une approche simple sans bibliothèques tierces utilisant Java 7

String path = "your complete file path";
MessageDigest md = MessageDigest.getInstance("MD5");
md.update(Files.readAllBytes(Paths.get(path)));
byte[] digest = md.digest();

Si vous devez imprimer ce tableau d'octets. Utilisez comme ci-dessous

System.out.println(Arrays.toString(digest));

Si vous avez besoin d'une chaîne hexadécimale hors de ce résumé. Utilisez comme ci-dessous

String digestInHex = DatatypeConverter.printHexBinary(digest).toUpperCase();
System.out.println(digestInHex);

où DatatypeConverter est javax.xml.bind.DatatypeConverter

sunil
la source
Pourquoi toUpperCase?
EdgeCaseBerg
@edgecaseberg juste pour que la chaîne hexagonale soit bonne lors de l'impression sur la console
sunil
J'ai trouvé que je devais utiliser toLowerCase () au lieu de toUpperCase ().
Splendor
14

J'ai récemment dû le faire pour une chaîne dynamique, qui MessageDigestpeut représenter le hachage de nombreuses façons. Pour obtenir la signature du fichier comme vous obtiendrez avec la commande md5sum, j'ai dû faire quelque chose comme ceci:

try {
   String s = "TEST STRING";
   MessageDigest md5 = MessageDigest.getInstance("MD5");
   md5.update(s.getBytes(),0,s.length());
   String signature = new BigInteger(1,md5.digest()).toString(16);
   System.out.println("Signature: "+signature);

} catch (final NoSuchAlgorithmException e) {
   e.printStackTrace();
}

Évidemment, cela ne répond pas à votre question sur la façon de le faire spécifiquement pour un fichier, la réponse ci-dessus traite bien ce calme. Je viens de passer beaucoup de temps à obtenir que la somme ressemble à la plupart des applications, et je pensais que vous pourriez rencontrer les mêmes problèmes.

Brian Gianforcaro
la source
La signature est le résumé au format hexadécimal. Moi aussi, j'ai trouvé que la représentation hexadécimale fonctionnait là où, comme vous le dites, d'autres représentations ne fonctionnent pas. Merci d'avoir mis cela en place.
Amit
C'est bien, mais .toString(16)cela supprimera les zéros de tête. String.format("%032x", ...)peut-être mieux.
Harold il y a
11
public static void main(String[] args) throws Exception {
    MessageDigest md = MessageDigest.getInstance("MD5");
    FileInputStream fis = new FileInputStream("c:\\apache\\cxf.jar");

    byte[] dataBytes = new byte[1024];

    int nread = 0;
    while ((nread = fis.read(dataBytes)) != -1) {
        md.update(dataBytes, 0, nread);
    };
    byte[] mdbytes = md.digest();
    StringBuffer sb = new StringBuffer();
    for (int i = 0; i < mdbytes.length; i++) {
        sb.append(Integer.toString((mdbytes[i] & 0xff) + 0x100, 16).substring(1));
    }
    System.out.println("Digest(in hex format):: " + sb.toString());
}

Ou vous pouvez obtenir plus d'informations http://www.asjava.com/core-java/java-md5-example/

Confiture
la source
9
String checksum = DigestUtils.md5Hex(new FileInputStream(filePath));
Ravikiran kalal
la source
9

Nous utilisions un code qui ressemble au code ci-dessus dans un article précédent en utilisant

...
String signature = new BigInteger(1,md5.digest()).toString(16);
...

Cependant, faites attention à l'utiliser BigInteger.toString()ici, car cela tronquera les zéros de tête ... (par exemple, essayez s = "27", la somme de contrôle devrait être "02e74f10e0327ad868d138f2b4fdd6f0")

J'appuie la suggestion d'utiliser Apache Commons Codec, j'ai remplacé notre propre code par cela.

user552999
la source
1
Wow, je cherchais un problème où le MD5 fonctionnait parfaitement pour tout, sauf qu'un fichier ne nous donnait qu'une sortie à 31 chiffres hexadécimaux et échouait les md5checksums. cette troncature des 0 en tête est une énorme douleur ... Merci pour votre note.
Mike
8
public static String MD5Hash(String toHash) throws RuntimeException {
   try{
       return String.format("%032x", // produces lower case 32 char wide hexa left-padded with 0
      new BigInteger(1, // handles large POSITIVE numbers 
           MessageDigest.getInstance("MD5").digest(toHash.getBytes())));
   }
   catch (NoSuchAlgorithmException e) {
      // do whatever seems relevant
   }
}
FX
la source
8

Méthode Java très rapide et propre qui ne repose pas sur des bibliothèques externes:

(Remplacez simplement MD5 par SHA-1, SHA-256, SHA-384 ou SHA-512 si vous le souhaitez)

public String calcMD5() throws Exception{
        byte[] buffer = new byte[8192];
        MessageDigest md = MessageDigest.getInstance("MD5");

        DigestInputStream dis = new DigestInputStream(new FileInputStream(new File("Path to file")), md);
        try {
            while (dis.read(buffer) != -1);
        }finally{
            dis.close();
        }

        byte[] bytes = md.digest();

        // bytesToHex-method
        char[] hexChars = new char[bytes.length * 2];
        for ( int j = 0; j < bytes.length; j++ ) {
            int v = bytes[j] & 0xFF;
            hexChars[j * 2] = hexArray[v >>> 4];
            hexChars[j * 2 + 1] = hexArray[v & 0x0F];
        }

        return new String(hexChars);
}
David
la source
6

Une autre implémentation: Fast MD5 Implementation in Java

String hash = MD5.asHex(MD5.getHash(new File(filename)));
Lukasz R.
la source
Je ne trouve pas la méthode MD5.asHex()dans JDK 1.8.0 242.
cbaldan
6

Méthode standard de l'environnement d'exécution Java :

public String checksum(File file) {
  try {
    InputStream fin = new FileInputStream(file);
    java.security.MessageDigest md5er =
        MessageDigest.getInstance("MD5");
    byte[] buffer = new byte[1024];
    int read;
    do {
      read = fin.read(buffer);
      if (read > 0)
        md5er.update(buffer, 0, read);
    } while (read != -1);
    fin.close();
    byte[] digest = md5er.digest();
    if (digest == null)
      return null;
    String strDigest = "0x";
    for (int i = 0; i < digest.length; i++) {
      strDigest += Integer.toString((digest[i] & 0xff) 
                + 0x100, 16).substring(1).toUpperCase();
    }
    return strDigest;
  } catch (Exception e) {
    return null;
  }
}

Le résultat est égal à l'utilitaire linux md5sum.

gotozero
la source
6

Voici une fonction simple qui enveloppe le code de Sunil pour qu'il prenne un fichier comme paramètre. La fonction n'a pas besoin de bibliothèques externes, mais elle nécessite Java 7.

import java.io.File;
import java.io.IOException;
import java.nio.file.Files;
import java.security.MessageDigest;
import java.security.NoSuchAlgorithmException;

import javax.xml.bind.DatatypeConverter;

public class Checksum {

    /**
     * Generates an MD5 checksum as a String.
     * @param file The file that is being checksummed.
     * @return Hex string of the checksum value.
     * @throws NoSuchAlgorithmException
     * @throws IOException
     */
    public static String generate(File file) throws NoSuchAlgorithmException,IOException {

        MessageDigest messageDigest = MessageDigest.getInstance("MD5");
        messageDigest.update(Files.readAllBytes(file.toPath()));
        byte[] hash = messageDigest.digest();

        return DatatypeConverter.printHexBinary(hash).toUpperCase();
    }

    public static void main(String argv[]) throws NoSuchAlgorithmException, IOException {
        File file = new File("/Users/foo.bar/Documents/file.jar");          
        String hex = Checksum.generate(file);
        System.out.printf("hex=%s\n", hex);            
    }


}

Exemple de sortie:

hex=B117DD0C3CBBD009AC4EF65B6D75C97B
stackoverflowuser2010
la source
3

Si vous utilisez ANT pour construire, c'est extrêmement simple. Ajoutez ce qui suit à votre build.xml:

<checksum file="${jarFile}" todir="${toDir}"/>

Où jarFile est le fichier JAR avec lequel vous souhaitez générer le MD5 et toDir est le répertoire dans lequel vous souhaitez placer le fichier MD5.

Plus d'infos ici.

Matt Brock
la source
3

Google goyave fournit une nouvelle API. Trouvez celui ci-dessous:

public static HashCode hash(File file,
            HashFunction hashFunction)
                     throws IOException

Computes the hash code of the file using hashFunction.

Parameters:
    file - the file to read
    hashFunction - the hash function to use to hash the data
Returns:
    the HashCode of all of the bytes in the file
Throws:
    IOException - if an I/O error occurs
Since:
    12.0
Balaji Boggaram Ramanarayan
la source
3

Voici une variante pratique qui utilise InputStream.transferTo()Java 9 et OutputStream.nullOutputStream()Java 11. Elle ne nécessite aucune bibliothèque externe et n'a pas besoin de charger le fichier entier en mémoire.

public static String hashFile(String algorithm, File f) throws IOException, NoSuchAlgorithmException {
    MessageDigest md = MessageDigest.getInstance(algorithm);

    try(BufferedInputStream in = new BufferedInputStream((new FileInputStream(f)));
        DigestOutputStream out = new DigestOutputStream(OutputStream.nullOutputStream(), md)) {
        in.transferTo(out);
    }

    String fx = "%0" + (md.getDigestLength()*2) + "x";
    return String.format(fx, new BigInteger(1, md.digest()));
}

et

hashFile("SHA-512", Path.of("src", "test", "resources", "some.txt").toFile());

Retour

"e30fa2784ba15be37833d569280e2163c6f106506dfb9b07dde67a24bfb90da65c661110cf2c5c6f71185754ee5ae3fd83a5465c92f72abd888b03187229da29"
Facture
la source
2
public static String getMd5OfFile(String filePath)
{
    String returnVal = "";
    try 
    {
        InputStream   input   = new FileInputStream(filePath); 
        byte[]        buffer  = new byte[1024];
        MessageDigest md5Hash = MessageDigest.getInstance("MD5");
        int           numRead = 0;
        while (numRead != -1)
        {
            numRead = input.read(buffer);
            if (numRead > 0)
            {
                md5Hash.update(buffer, 0, numRead);
            }
        }
        input.close();

        byte [] md5Bytes = md5Hash.digest();
        for (int i=0; i < md5Bytes.length; i++)
        {
            returnVal += Integer.toString( ( md5Bytes[i] & 0xff ) + 0x100, 16).substring( 1 );
        }
    } 
    catch(Throwable t) {t.printStackTrace();}
    return returnVal.toUpperCase();
}
XXX
la source