Avantages du format DOCX par rapport à DOC

9

Aujourd'hui, j'ai accidentellement découvert que le .docx est le même .zip (ou il n'y a pas de grande différence entre eux). Lorsque vous changez le .docx en .zip et ouvrez avec WinRAR, vous voyez un tas de fichiers XML dans les dossiers. Dans ce fichier XML, il est stocké le texte, les polices, le propriétaire, la dernière modification, etc. En un mot, toutes les informations sont stockées sous forme de données XML.

Mais il n'en va pas de même pour les fichiers d'extension .doc. Il est impossible de les ouvrir en tant que .zip op que .rar.

Alors question: quel est l'avantage de stocker les données de .docx en XML que Microsoft a changé la façon de stocker les données? En effet, je ne veux pas connaître l'avantage du format XML mais pourquoi Microsoft utilise plusieurs fichiers XML pour stocker les données .docx. Il s'avère que .docx n'est pas un nouveau format à la racine.

Narek
la source
En 1 minute .. 5 presque les mêmes réponses. La puissance de SO.
MRG
1
Avoir des données au format XML ne signifie pas qu'il ne s'agit pas d'un nouveau format. Vous ne pouvez pas introduire ce XML dans OpenOffice et le rendre correctement. Vous devez clairement définir quelle sera la structure XML, quels attributs, quels éléments, etc.
1
Pensez à changer le titre en quelque chose de plus informatif.
Carl Bergquist,
2
Bien sûr, c'est un nouveau format. Allez donc.
Chers Janis Veinbergs et Kyle Rozendo J'ai beaucoup travaillé avec XML et XSD et je sais comment cela fonctionne !!! Soyez attentif j'ai dit "à la racine". Vous ne pouvez pas convenir que c'est le format XML qui vient d'être utilisé, pas un nouveau format !!!!
Narek

Réponses:

12

Un .docxfichier peut stocker des ressources incorporées, comme des fichiers image, pas seulement des fichiers XML. Au lieu d'encoder des trucs en base64 ou quelque chose et de les stocker dans un fichier XML ou d'inventer un autre format de sérialisation binaire, ils ont décidé d'aller avec le format ZIP standard.

À côté de cela, XML est un format de fichier très détaillé contenant de nombreux modèles redondants. Vous pouvez obtenir un taux de compression élevé pour les fichiers XML.

Soit dit en passant, je ne comprends pas vraiment la partie "nous tromper". Est-il préférable d'inventer un nouveau format de fichier crypté à partir de zéro ou d'utiliser un format standard connu?

Mehrdad Afshari
la source
Le principal avantage que je vois est qu'il existe des API ouvertes pour réellement créer ces fichiers, donc la création de fichiers .docx à partir de zéro est possible sans dépenser beaucoup en SDK propriétaires. Le SDK Microsoft fournit même un réflecteur de document qui générera du code C # pour générer un document prédéfini à partir de zéro.
Will Eddins,
@Guard: Ouais. Ma réponse concerne la version originale de la question. La question a considérablement changé depuis lors;) Le titre d'origine était "Microsoft triche?"
Mehrdad Afshari
xml ne fait pas en soi un format "connu", .docx étant l'un des meilleurs exemples.
artistoex
5

L' article de Wikipedia résume assez bien:

"Microsoft a été soumis à une pression croissante pour adopter un format de fichier ouvert, en particulier plusieurs pays ont adopté des règles selon lesquelles les documents officiels devraient être dans un format ouvert."

Edit: Et le compresser a beaucoup de sens, car le XML est très verbeux et se comprime très bien naturellement.

Henning
la source
3
"Ouvrir" ne signifie pas "peut être décompressé".
Greg Hewgill
3
La fermeture éclair a d'autres avantages que la compression. Il agit également comme un conteneur pour plusieurs fichiers.
Joey
3

L'utilisation d'un fichier .zip renommé est une pratique assez courante - par exemple, les fichiers .pak de Quake III sont vraiment des fichiers .zip. Inutile d'inventer votre propre format de fichier compressé alors qu'il en existe déjà de très bons.

Greg
la source
1
Plus d'exemples d'utilisation des archives ZIP: Java .jar, Winamp .wsz/ .wal(skins), Firefox .xpi(XPInstaller - thèmes, addons). (les tararchives sont également populaires.)
user1686
1

Ce n'est pas seulement Office Open XML qui utilise du XML compressé. OpenDocument d'Open Office fait de même dans les coulisses.

Il y a quelques avantages répertoriés sur la page Wikipedia sur les conventions d'emballage ouvert :

Indirection

Prenons l'exemple d'un catalogue où un logo est répété 1 000 fois. En utilisant un mécanisme d'indirection, si nous voulons changer le logo, nous devons seulement changer une entrée dans un fichier, sans recherche, car nous savons où chercher. Cela augmente considérablement la maintenabilité. Si vous voulez changer la disposition, par exemple, des répertoires ZIP où vos fichiers sont stockés, cela devient une question triviale, car vous n'avez pas besoin de connaître tous les éléments qui peuvent pointer vers un fichier, ils sont tous au même endroit.

Regrouper

Il encourage les documents à être divisés en petits morceaux. C'est mieux pour réduire l'effet de la corruption de fichiers. Et mieux pour l'accès aux données: par exemple, toutes les informations de style dans une partie XML, chaque feuille de calcul ou tableau séparé dans leurs propres parties différentes. Cela permet un accès plus rapide et moins de création d'objets pour les clients, et facilite le travail de plusieurs processus sur le même document.

La segmentation profite également aux programmeurs. Le remplacement d'une feuille de style par une autre devient une opération de fichier ZIP, pas une opération XML. Et cela réduit la quantité de choses qu'un programmeur doit comprendre, car il peut approcher les morceaux en supposant que toutes les informations sur un sujet se trouvent dans ce morceau: il est épargné le labeur mental de devoir parcourir un gros fichier avec beaucoup de éléments étrangers.

Indirection relative

Dans les conventions Open Packaging, chaque fichier référencé a son propre fichier _rels avec les listes d'indirection. Dans certains cas, cela permet de couper et de coller plus facilement certaines informations avec toutes les ressources associées, fournit une portée de nom pour supprimer les risques de conflit de noms entre les fichiers, etc.

Joey
la source
0

Le plus grand avantage est que vous pouvez accéder à vos données en décompressant le fichier et en copiant le texte des fichiers xml. Cela peut être fait avec un utilitaire zip et un éditeur de texte, même si vous n'avez pas de copie de Word 2007.

C'est ce qui rend le format plus ouvert que les anciens formats binaires.

Joe Internet
la source