J'ai créé un simple document MS Word contenant uniquement cette phrase:
Ceci est un petit document.
Rien d'autre. Ensuite, j'ai enregistré ce document au format DOCX et PDF. Voici les tailles de fichiers:
DOCX: 12 ko
PDF: 89 ko
Techniquement, la différence est énorme et cela commence vraiment à me gêner lorsque la plupart des documents textuels de plusieurs dizaines de ko dans DOCX commencent à générer des PDF de plusieurs centaines de ko . En quoi le format PDF est-il si inefficace? Ou bien Word utilise-t-il un algorithme de sortie terrible?
BTW, les paramètres de sortie PDF ont été définis pour créer le plus petit fichier possible:
microsoft-word
pdf
docx
Borek Bernard
la source
la source
Réponses:
Si vous ouvrez le PDF dans Notepad ++, vous trouverez:
et cet objet est référencé ici à la fin dans l'instruction / FontFile2:
Les polices utilisées par le document Word sont incorporées dans le PDF, de sorte que le fichier PDF est autonome.
J'ai utilisé cette diapositive pour déchiffrer les instructions au format PDF.
Si vous souhaitez empêcher les polices d'être incorporées dans le fichier PDF, assurez-vous que votre document Word utilise l'une des 14 polices de caractères standard disponibles dans les lecteurs PDF, (source Wikipedia ).
la source
Cela m'est souvent arrivé dans Microsoft Word lorsque j'essayais d'exporter un manuscrit simple au format PDF. Un document Word de 5 à 8 pages, d’une taille d’environ 50 Ko, se transforme en un fichier PDF de plus de 10 Mo.
La réponse de René est sur la bonne voie - le problème est que les polices sont incorporées dans le document - mais l'utilisation de l'une des polices de caractères standard ne résoudra pas nécessairement le problème.
Tous mes documents étaient au format Times New Roman et n’utilisaient rien de plus sophistiqué que le gras et l’italique. Ou alors j'ai pensé. Il se trouve que le crénage automatique est activé dans mon modèle par défaut (pour des raisons évidentes ). Lors de l'exportation au format PDF, Word intégrait chacune de ces ligatures en tant qu'objet de police distinct dans le document, le gonflant au-delà de toute croyance.
Le correctif est simple, vous devez juste vous rappeler de le faire à chaque fois:
Il est intéressant de noter que vous pouvez laisser les ligatures, les alternatives contextuelles et d’autres fonctionnalités de typographie avancées activées. ils n'ont aucun effet perceptible sur la taille du fichier PDF résultant.
Ré-exportez le document au format PDF et ne disposez plus que d'une centaine de Ko. Malheureusement, le crénage est insuffisant, je ne recommanderais donc pas l'impression de cette façon, mais cela fonctionne bien pour l'envoi d'un document par courrier électronique.
la source
Pour donner une réponse moins technique qui puisse aider, les PDF utilisent des vecteurs (c'est-à-dire des équations mathématiques) pour décrire tout ce que vous voyez. Toutes les courbes et les lignes sont définies par des équations mathématiques. Il y aura donc forcément beaucoup d'informations à conserver, en particulier lorsque vous avez des images dans vos documents.
L'avantage de cela est que vous pouvez théoriquement zoomer à l'infini sans perdre la résolution ou les détails, car les lignes et les courbes n'ont pas de largeur et peuvent donc être redimensionnées avec votre zoom.
Tout comme la modification récente des polices par Google a réduit la taille du logo de ~ 14 Ko à ~ 300 Ko, des polices plus simples vous aideront probablement à réduire la taille de votre fichier.
la source