Comment la «taille du mot» affecte-t-elle la compression?

24

Dans 7 Zip lors de l'ajout d'un dossier à une archive, il est possible de modifier la taille du mot.

Comment cette taille de mot affecte-t-elle la compression, en particulier la taille finale du zip?

J'ai remarqué que la modification du niveau de compression augmente la taille du mot, mais même sur ultra, il ne sélectionne qu'une taille de mot de 128, même si la plus grande option est plus du double. Y a-t-il une raison pour laquelle ultra ne sélectionne pas le plus grand? La taille de compression optimale se situe-t-elle entre la plus grande et la plus petite taille de mot?

Aequitas
la source
Découvrez ce que Shell dit sur cet article sur une partie de vos questions ici -> The Post .
Pimp Juice IT
@LMFAO_A_JOKE qui dit simplement que pour certains fichiers plus élevés est parfois mieux non
Aequitas
1
Cela ne répond pas à toutes vos questions dans les moindres détails, mais pour la seule question de -> How does this word size affect compression, in particular the final size of the zip?Je pense que la partie de l'article indiquant WordSize: usually the bigger, the better (and slower) for well-compressible data (such as documents). Archive size depends quite non-monotonically of it.vous donne une explication à PART de votre ensemble de questions. C'est pourquoi je ne l'ai mis ici que pour un commentaire et je n'ai PAS répondu - j'essaye juste de vous donner quelque chose !!!
Pimp Juice IT
Que signifie la dernière phrase, Taille de l'archive ... non monotone
Aequitas
1
Je pense que cela signifie que la taille de l'archive sera plus petite (diminuant la taille de la taille d'origine plus) "généralement" avec la plus grande valeur WordSize, mais cela "dépend" de la compressibilité des types de données qui sont compressés tels que le texte par opposition aux fichiers image peut-être à titre d'exemple. La suggestion était de tester les différentes valeurs pour obtenir la valeur la plus optimale pour vos données, mais pour savoir que vous choisissez les meilleures options pour répondre à vos besoins.
Pimp Juice IT

Réponses:

8

Cela dépend vraiment des données que vous compressez et de l'algorithme utilisé.

Taille de mot

Entrez la longueur des mots, qui sera utilisée pour trouver des séquences d'octets identiques pour la compression. Pour LZMA, les gros mots donnent généralement un meilleur taux de compression et un processus de compression plus lent. Un paramètre de taille de mot important peut augmenter considérablement le taux de compression dans le cas où les fichiers contiennent de longues séquences d'octets identiques. Pour PPMd, la taille des mots a une grande signification. Il affecte fortement le taux de compression et la vitesse de compression / décompression.

Il y a quelques comparaisons ici

Hefewe1zen
la source