Aujourd'hui, j'ai accidentellement découvert que le .docx est le même .zip (ou il n'y a pas de grande différence entre eux). Lorsque vous changez le .docx en .zip et ouvrez avec WinRAR, vous voyez un tas de fichiers XML dans les dossiers. Dans ce fichier XML, il est stocké le texte, les polices, le propriétaire, la dernière modification, etc. En un mot, toutes les informations sont stockées sous forme de données XML.
Mais il n'en va pas de même pour les fichiers d'extension .doc. Il est impossible de les ouvrir en tant que .zip op que .rar.
Alors question: quel est l'avantage de stocker les données de .docx en XML que Microsoft a changé la façon de stocker les données? En effet, je ne veux pas connaître l'avantage du format XML mais pourquoi Microsoft utilise plusieurs fichiers XML pour stocker les données .docx. Il s'avère que .docx n'est pas un nouveau format à la racine.
la source
Réponses:
Un
.docx
fichier peut stocker des ressources incorporées, comme des fichiers image, pas seulement des fichiers XML. Au lieu d'encoder des trucs en base64 ou quelque chose et de les stocker dans un fichier XML ou d'inventer un autre format de sérialisation binaire, ils ont décidé d'aller avec le format ZIP standard.À côté de cela, XML est un format de fichier très détaillé contenant de nombreux modèles redondants. Vous pouvez obtenir un taux de compression élevé pour les fichiers XML.
Soit dit en passant, je ne comprends pas vraiment la partie "nous tromper". Est-il préférable d'inventer un nouveau format de fichier crypté à partir de zéro ou d'utiliser un format standard connu?
la source
L' article de Wikipedia résume assez bien:
"Microsoft a été soumis à une pression croissante pour adopter un format de fichier ouvert, en particulier plusieurs pays ont adopté des règles selon lesquelles les documents officiels devraient être dans un format ouvert."
Edit: Et le compresser a beaucoup de sens, car le XML est très verbeux et se comprime très bien naturellement.
la source
L'utilisation d'un fichier .zip renommé est une pratique assez courante - par exemple, les fichiers .pak de Quake III sont vraiment des fichiers .zip. Inutile d'inventer votre propre format de fichier compressé alors qu'il en existe déjà de très bons.
la source
.jar
, Winamp.wsz
/.wal
(skins), Firefox.xpi
(XPInstaller - thèmes, addons). (lestar
archives sont également populaires.)Ce n'est pas seulement Office Open XML qui utilise du XML compressé. OpenDocument d'Open Office fait de même dans les coulisses.
Il y a quelques avantages répertoriés sur la page Wikipedia sur les conventions d'emballage ouvert :
la source
Le plus grand avantage est que vous pouvez accéder à vos données en décompressant le fichier et en copiant le texte des fichiers xml. Cela peut être fait avec un utilitaire zip et un éditeur de texte, même si vous n'avez pas de copie de Word 2007.
C'est ce qui rend le format plus ouvert que les anciens formats binaires.
la source