Il existe de nombreux programmes de compression à usage général. 7z, zip, tar et etc ( https://en.wikipedia.org/wiki/Comparison_of_file_archivers )
En fonction du type de données, on peut obtenir de meilleurs résultats (rapport vitesse / taille)
Je veux savoir s'il existe un moyen rapide (éventuellement une approche heuristique) de dire que pour un fichier / fichier donné, un fichier fonctionne mieux qu'un autre.
compression
zip
tar
7-zip
nafas
la source
la source
tar
lui-même n'est pas un compresseur; il peut être associé à n’importe quel compresseur sans perte et, de nos jours, il est généralement associé àgzip bzip2 xz/lzma
des compresseurs moins efficaces qui existaient il ya quelques années.Réponses:
De nombreux programmes différents utilisent les mêmes algorithmes, de sorte que les niveaux de compression seront similaires pour différents programmes aux mêmes formats, bien que les performances dépendent dans une certaine mesure de la façon dont ils sont codés.
Le format ZIP utilise l'algorithme de Lempel-Ziv, qui fonctionne bien pour les données de texte général, mais pas nécessairement pour les autres formats. Des algorithmes spécialisés ont donc été développés pour d'autres formats.
Les autres algorithmes pour différents types de données utilisent les caractéristiques connues des données pour faciliter la recherche des éléments compressibles, bien que ceux-ci soient généralement intégrés aux fichiers stockés eux-mêmes: PNG et FLAC sont des formats multimédias sans perte bien connus. De tels fichiers peuvent rarement être compressés davantage, et les tentatives pour le faire augmentent généralement la taille du fichier.
En ce qui concerne la vitesse, la plupart des utilisateurs préfèrent les vitesses de décompression les plus élevées au prix d'une compression plus lente, mais certains algorithmes donnent un équilibre différent, bien que les niveaux de compression soient généralement plus faibles.
Sans faire de tests, vous devrez consulter la littérature: voici un bon point de départ, même si une grande partie de l’article traite des formats avec perte.
La seule approche heuristique consiste à examiner les algorithmes eux-mêmes et à vous faire votre propre idée de leurs performances.
En tant que postscript, notez que TAR est un format d’ archive , et non un format de compression, bien que le programme de gestion gère le format compressé TGZ.
la source