Comment puis-je extraire une plage de pages / une partie d'un fichier PDF?

423

Avez-vous une idée sur la façon d'extraire une partie d'un document PDF et de l'enregistrer au format PDF? Sous OS X, l’aperçu est absolument trivial. J'ai essayé PDF Editor et d'autres programmes, mais en vain.

Je souhaite un programme dans lequel je sélectionne la partie souhaitée et le sauvegarde au format PDF avec une simple commande telle que CMD+ Nsous OS X. Je souhaite que la partie extraite soit enregistrée au format PDF et non au format jpeg, etc.

utilisateur72469
la source
Avez-vous essayé ImageMagick?
Martin Schröder
3
C'est pour bitmap j'ai besoin de quelque chose qui enregistre au format PDF!
user72469
3
pdfshufflerdans le repos.
Marc
2
pdfshufflerne fonctionne plus dans Ubuntu 14.04+. Vous pouvez toujours utiliser la boîte de dialogue Imprimer ou une alternative basée sur un terminal, telle quepdfseparate
Rho
@Rho La version directement installée via apt-getfonctionne toujours pour moi en 16.04. Peut-être qu'ils ont corrigé les bugs, s'il y en avait?
xji

Réponses:

477

pdftkest un outil multi-plateforme utile pour le travail ( page d'accueil pdftk ).

pdftk full-pdf.pdf cat 12-15 output outfile_p12-15.pdf

vous transmettez le nom de fichier du fichier PDF principal, puis vous lui indiquez d’inclure uniquement certaines pages (12-15 dans cet exemple) et vous le exportez dans un nouveau fichier.

Martin H
la source
6
Si je veux extraire les pages 1-10, 15 et 17, comment puis-je écrire la commande?
Patrick Li
31
@PatrickLipdftk A=in.pdf cat A1-10 A15 A17 output out.pdf
m8mble
9
Notez que ce pdftkn'est pas disponible dans Ubuntu 18.04. (voir askubuntu.com/questions/1028522/… )
alkamid
6
@alkamid c'est: sudo snap install pdftk
Qubix
12
Bien que ce pdftksoit certainement un outil qui puisse faire le travail, je le déconseille. Ce n'est pas un logiciel libre, mais un partagiciel maladroit. En outre, il a besoin de la machine virtuelle Java. Un outil plus raisonnable est qpdf, comme suggéré dans une autre réponse .
gauche du
245

très simple, utilisez le lecteur PDF par défaut:

imprimer en fichier. c'est ça! menu d'impression

ensuite

mise en nouveau PDF

Abdennour TOUMI
la source
12
flippin brillant
andybleaden
17
Produit des résultats catastrophiques avec les fichiers Beamer, les cartes et tout autre document non conforme au format de page de l'imprimante.
Luís de Sousa
11
Cela peut entraîner un fichier de taille beaucoup plus grande que le document d'origine.
dat
7
il ne "extrait" donc pas la plage de pages. Il crée un nouveau fichier PDF à partir de l’ancien, comme si vous utilisiez une paire imprimante / scanner haute définition.
Sylvainulg
6
Bon pour les cas simples, mais les résultats non souhaités dans les documents contenant des commentaires en surbrillance: la surbrillance devient une opacité de 100% et bloque le texte.
loved.by.Jesus
79

Plage de pages - Script Nautilus


Vue d'ensemble

J'ai créé un script légèrement plus avancé basé sur le tutoriel @ThiagoPonte associé. Ses principales caractéristiques sont

  • qu'il est basé sur une interface graphique,
  • compatible avec les espaces dans les noms de fichiers,
  • et basé sur trois arrière-plans différents qui sont capables de préserver tous les attributs du fichier d'origine

Capture d'écran

entrez la description de l'image ici

Code

#!/bin/bash
#
# TITLE:        PDFextract
#
# AUTHOR:       (c) 2013-2015 Glutanimate (https://github.com/Glutanimate)
#
# VERSION:      0.2
#
# LICENSE:      GNU GPL v3 (http://www.gnu.org/licenses/gpl.html)
# 
# OVERVIEW:     PDFextract is a simple PDF extraction script based on Ghostscript/qpdf/cpdf.
#               It provides a simple way to extract a page range from a PDF document and is meant
#               to be used as a file manager script/addon (e.g. Nautilus script).
#
# FEATURES:     - simple GUI based on YAD, an advanced Zenity fork.
#               - preserves _all_ attributes of your original PDF file and does not compress 
#                 embedded images further than they are.      
#               - can choose from three different backends: ghostscript, qpdf, cpdf
#
# DEPENDENCIES: ghostscript/qpdf/cpdf poppler-utils yad libnotify-bin
#                         
#               You need to install at least one of the three backends supported by this script.
#
#               - ghostscript, qpdf, poppler-utils, and libnotify-bin are available via 
#                 the standard Ubuntu repositories
#               - cpdf is a commercial CLI PDF toolkit that is free for personal use.
#                 It can be downloaded here: https://github.com/coherentgraphics/cpdf-binaries
#               - yad can be installed from the webupd8 PPA with the following command:
#                 sudo add-apt-repository ppa:webupd8team/y-ppa-manager && apt-get update && apt-get install yad
#
# NOTES:        Here is a quick comparison of the advantages and disadvantages of each backend:
#
#                               speed     metadata preservation     content preservation        license
#               ghostscript:     --               ++                         ++               open-source
#               cpdf:             -               ++                         ++               proprietary
#               qpdf:            ++                +                         ++               open-source
#
#               Results might vary depending on the document and the version of the tool in question.
#
# INSTALLATION: https://askubuntu.com/a/236415
#
# This script was inspired by Kurt Pfeifle's PDF extraction script 
# (http://www.linuxjournal.com/content/tech-tip-extract-pages-pdf)
#
# Originally posted on askubuntu
# (https://askubuntu.com/a/282453)

# Variables

DOCUMENT="$1"
BACKENDSELECTION="^qpdf!ghostscript!cpdf"

# Functions

check_input(){
  if [[ -z "$1" ]]; then
    notify "Error: No input file selected."
    exit 1
  elif [[ ! "$(file -ib "$1")" == *application/pdf* ]]; then
    notify "Error: Not a valid PDF file."
    exit 1
  fi
}

check_deps () {
  for i in "$@"; do
    type "$i" > /dev/null 2>&1 
    if [[ "$?" != "0" ]]; then
      MissingDeps+="$i"
    fi
  done
}

ghostscriptextract(){
  gs -dFirstPage="$STARTPAGE "-dLastPage="$STOPPAGE" -sOutputFile="$OUTFILE" -dSAFER -dNOPAUSE -dBATCH -dPDFSETTING=/default -sDEVICE=pdfwrite -dCompressFonts=true -c \
  ".setpdfwrite << /EncodeColorImages true /DownsampleMonoImages false /SubsetFonts true /ASCII85EncodePages false /DefaultRenderingIntent /Default /ColorConversionStrategy \
  /LeaveColorUnchanged /MonoImageDownsampleThreshold 1.5 /ColorACSImageDict << /VSamples [ 1 1 1 1 ] /HSamples [ 1 1 1 1 ] /QFactor 0.4 /Blend 1 >> /GrayACSImageDict \
  << /VSamples [ 1 1 1 1 ] /HSamples [ 1 1 1 1 ] /QFactor 0.4 /Blend 1 >> /PreserveOverprintSettings false /MonoImageResolution 300 /MonoImageFilter /FlateEncode \
  /GrayImageResolution 300 /LockDistillerParams false /EncodeGrayImages true /MaxSubsetPCT 100 /GrayImageDict << /VSamples [ 1 1 1 1 ] /HSamples [ 1 1 1 1 ] /QFactor \
  0.4 /Blend 1 >> /ColorImageFilter /FlateEncode /EmbedAllFonts true /UCRandBGInfo /Remove /AutoRotatePages /PageByPage /ColorImageResolution 300 /ColorImageDict << \
  /VSamples [ 1 1 1 1 ] /HSamples [ 1 1 1 1 ] /QFactor 0.4 /Blend 1 >> /CompatibilityLevel 1.7 /EncodeMonoImages true /GrayImageDownsampleThreshold 1.5 \
  /AutoFilterGrayImages false /GrayImageFilter /FlateEncode /DownsampleGrayImages false /AutoFilterColorImages false /DownsampleColorImages false /CompressPages true \
  /ColorImageDownsampleThreshold 1.5 /PreserveHalftoneInfo false >> setdistillerparams" -f "$DOCUMENT"
}

cpdfextract(){
  cpdf "$DOCUMENT" "$STARTPAGE-$STOPPAGE" -o "$OUTFILE"
}

qpdfextract(){
  qpdf --linearize "$DOCUMENT" --pages "$DOCUMENT" "$STARTPAGE-$STOPPAGE" -- "$OUTFILE"
  echo "$OUTFILE"
  return 0 # even benign qpdf warnings produce error codes, so we suppress them
}

notify(){
  echo "$1"
  notify-send -i application-pdf "PDFextract" "$1"
}

dialog_warning(){
  echo "$1"
  yad --center --image dialog-warning \
  --title "PDFExtract Warning" \
  --text "$1" \
  --button="Try again:0" \
  --button="Exit:1"

  [[ "$?" != "0" ]] && exit 0
}

dialog_settings(){
  PAGECOUNT=$(pdfinfo "$DOCUMENT" | grep Pages | sed 's/[^0-9]*//') #determine page count

  SETTINGS=($(\
      yad --form --width 300 --center \
          --window-icon application-pdf --image application-pdf \
          --separator=" " --title="PDFextract"\
          --text "Please choose the page range and backend"\
          --field="Start:NUM" 1[!1..$PAGECOUNT[!1]] --field="End:NUM" $PAGECOUNT[!1..$PAGECOUNT[!1]] \
          --field="Backend":CB "$BACKENDSELECTION" \
          --button="gtk-ok:0" --button="gtk-cancel:1"\
      ))

  SETTINGSRET="$?"

  [[ "$SETTINGSRET" != "0" ]] && exit 1

  STARTPAGE=$(printf %.0f ${SETTINGS[0]}) #round numbers and store array in variables
  STOPPAGE=$(printf %.0f ${SETTINGS[1]})
  BACKEND="${SETTINGS[2]}"
  EXTRACTOR="${BACKEND}extract"

  check_deps "$BACKEND"

  if [[ -n "$MissingDeps" ]]; then
    dialog_warning "Error, missing dependency: $MissingDeps"
    unset MissingDeps
    dialog_settings
    return
  fi

  if [[ "$STARTPAGE" -gt "$STOPPAGE" ]]; then 
    dialog_warning "<b>   Start page higher than stop page.   </b>"
    dialog_settings
    return
  fi

  OUTFILE="${DOCUMENT%.pdf} (p${STARTPAGE}-p${STOPPAGE}).pdf"
}

extract_pages(){
  $EXTRACTOR
  EXTRACTORRET="$?"
  if [[ "$EXTRACTORRET" = "0" ]]; then
    notify "Pages $STARTPAGE to $STOPPAGE succesfully extracted."
  else
    notify "There has been an error. Please check the CLI output."
  fi
}


# Main

check_input "$1"
dialog_settings
extract_pages

Installation

Veuillez suivre les instructions d'installation génériques pour les scripts Nautilus . Assurez-vous de lire attentivement l'en-tête du script, car cela vous aidera à clarifier l'installation et l'utilisation du script.


Pages partielles - PDF Shuffler


Vue d'ensemble

PDF-Shuffler est une petite application python-gtk, qui permet à l'utilisateur de fusionner ou de scinder des documents pdf et de faire pivoter, rogner et réorganiser leurs pages à l'aide d'une interface graphique interactive et intuitive. C'est une interface pour python-pyPdf.

Installation

sudo apt-get install pdfshuffler

Usage

PDF-Shuffler peut rogner et supprimer des pages PDF individuelles. Vous pouvez l'utiliser pour extraire une plage de pages d'un document ou même de pages partielles à l'aide de la fonction de recadrage:

entrez la description de l'image ici


Éléments de page - Inkscape


Vue d'ensemble

Inkscape est un éditeur de graphiques vectoriels open source très puissant. Il prend en charge un large éventail de formats différents, y compris les fichiers PDF. Vous pouvez l'utiliser pour extraire, modifier et enregistrer des éléments de page à partir d'un fichier PDF.

Installation

sudo apt-get install inkscape

Usage

1.) Ouvrez le fichier PDF de votre choix avec Inkscape. Une boîte de dialogue d'importation apparaîtra. Choisissez la page que vous souhaitez extraire des éléments. Laissez les autres paramètres tels quels:

entrez la description de l'image ici

2.) Dans Inkscape, cliquez et faites glisser pour sélectionner le ou les éléments à extraire:

entrez la description de l'image ici

3.) Inversez la sélection avec !et supprimez l'objet sélectionné avec DELETE:

entrez la description de l'image ici

4.) Recadrez le document dans les objets restants en accédant à la boîte de dialogue Propriétés du document avec CTRL+ SHIFT+ Det en sélectionnant "Ajuster le document à l'image":

entrez la description de l'image ici

5.) Enregistrez le document en tant que fichier PDF à partir de la boîte de dialogue Fichier -> Enregistrer sous :

6.) S'il y a des images bitmap / raster dans votre document recadré, vous pouvez définir leur DPI dans la boîte de dialogue qui apparaît ensuite:

entrez la description de l'image ici

7.) Si vous avez suivi toutes les étapes, vous aurez créé un véritable fichier PDF contenant uniquement les objets de votre choix:

entrez la description de l'image ici

Glutanimate
la source
Grand effort. Merci! Je comprends que cela ne permet pas de sélectionner une partie de page, mais uniquement des pages entières. Ai-je raison?
Carnendil
2
@carnendil: Oui, exactement. Je ne pense pas que Ghostscript en soit capable. Mais il pourrait y avoir d'autres solutions pour le faire par programme . Pour le moment, j'ai édité ma réponse avec une solution alternative (et un peu furtive) utilisant PDF-shuffler.
Glutanimate
3
ok, j'ai ajouté une méthode différente en utilisant Inkscape.
Glutanimate
1
pdfshufflern'est pas suffisant si vous souhaitez extraire une partie de la page PDF. Les données PDF d'origine de la page sont toujours conservées dans le fichier. N'utilisez pas cette méthode si vous souhaitez supprimer des données sensibles d'un fichier PDF.
Rob W
pdfshufflerest maintenant appelé pdfarranger.
Amoe
72

QPDF est génial. Utilisez-le pour extraire les pages 1 à 10 input.pdfet enregistrez-le sous output.pdf.

qpdf --pages input.pdf 1-10 -- input.pdf output.pdf

S'il vous plaît noter que input.pdfest écrit deux fois.

Vous pouvez l'installer en appelant:

sudo apt-get install qpdf

C'est un excellent outil pour la manipulation de PDF, qui est très rapide, a très peu de dépendances. "Il peut chiffrer et linéariser des fichiers, exposer les éléments internes d'un fichier PDF et effectuer de nombreuses autres opérations utiles aux utilisateurs finaux et aux développeurs PDF."

http://sourceforge.net/projects/qpdf/

Ho1
la source
3
Le seul problème que j’ai eu avec cela est qu’il répertorie toujours toutes les pages de la table des matières, même si la plupart ont été supprimées. A part ça, merci beaucoup! :)
Wilf
3
Excellent logiciel. Nice
Anwar
2
Attention - Les fichiers sont tous énormes, de la même taille que l’original.
Corey Alix
3
Fonctionne, mais cette syntaxe pour spécifier les pages (lister le fichier d'entrée deux fois, puis l'ajouter --) est vraiment bizarre.
Dan Dascalescu
3
Le drapeau --pages vous permet de joindre des pages de plusieurs fichiers PDF. Notez que vous pouvez éviter de dupliquer le nom en utilisant .à la place du fichier d'entrée dans les options --pages: qpdf --pages . 1-10 -- input.pdf output.pdf.
Bart
43

Enregistrez ceci en tant que script shell, comme pdfextractor.sh:

#!/bin/bash
# this function uses 3 arguments:
#     $1 is the first page of the range to extract
#     $2 is the last page of the range to extract
#     $3 is the input file
#     output file will be named "inputfile_pXX-pYY.pdf"
gs -sDEVICE=pdfwrite -dNOPAUSE -dBATCH -dSAFER \
   -dFirstPage="${1}" \
   -dLastPage="${2}" \
   -sOutputFile="${3%.pdf}_p${1}-p${2}.pdf" \
   "${3}"

Pour exécuter tapez:

./pdfextractor.sh 4 20 myfile.pdf
  1. 4 se réfère à la page, il va commencer le nouveau pdf.

  2. 20 fait référence à la page avec laquelle se terminera le pdf.

  3. myfile.pdf est le fichier pdf que vous souhaitez extraire des pièces.

La sortie serait myfile_p4_p20.pdfdans le même répertoire que le fichier pdf original.

Tout cela et plus d'informations ici: Tech Tip

ThiagoPonte
la source
16
Restons simples:gs -sDEVICE=pdfwrite -dNOPAUSE -dBATCH -dFirstPage=1 -dLastPage=10 -sOutputFile=output.pdf input.pdf
Ho1
et Comment puis-je spécifier le fichier d'entrée?
Anwar
1
-1 pour faire l'expansion des paramètres bash en dehors de la chaîne entre guillemets. (devrait être "-sOutputFile=${3%.pdf}_p${1}-p${2}.pdf"etc. (notez les guillemets)).
Rotsor
1
@ Ho1 s'il vous plaît écrivez-le comme une nouvelle réponse, ça aide vraiment!
Joshua Salazar
C'est la réponse la plus portable, car ghostscript sera probablement installé n'importe où.
Calimo
29

Dans tout système sur lequel une distribution TeX est installée:

pdfjam <input file> <page ranges> -o <output file>

Par exemple:

pdfjam original.pdf 5-10 -o out.pdf

Voir https://tex.stackexchange.com/a/79626/8666

Ioannis Filippidis
la source
c'était le seul qui a fonctionné pour moi.
FireInTheSky
27

Il existe un utilitaire de ligne de commande appelé pdfseparate .

De la docs:

pdfseparate sample.pdf sample-%d.pdf

extracts  all pages from sample.pdf, if i.e. sample.pdf has 3 pages, it
   produces

sample-1.pdf, sample-2.pdf, sample-3.pdf

Ou, pour sélectionner une seule page (dans ce cas, la première page) à partir du fichier sample.pdf:

pdfseparate -f 1 -l 1 sample.pdf sample-1.pdf
jdmcbr
la source
2
excellent outil! beaucoup plus rapide quepdftk
Anwar
3
Bien, mais cela ne se limite qu’à une page, et si vous voulez plus que cela, vous obtiendrez des pages séparées.
Ho1
2
Bien sûr, vous pouvez suivre la commande ci-dessus avec pdfunite pour produire un seul document.
jdmcbr
3
Si vous avez un document volumineux et que vous devez scinder toutes les pages, il est très rapide et utile.
MEDVIS
19

pdftk( sudo apt-get install pdftk) est également une excellente ligne de commande pour la manipulation de PDF. Voici quelques exemples de ce que vous pdftkpouvez faire:

   Collate scanned pages
     pdftk A=even.pdf B=odd.pdf shuffle A B output collated.pdf
     or if odd.pdf is in reverse order:
     pdftk A=even.pdf B=odd.pdf shuffle A Bend-1 output collated.pdf

   Join in1.pdf and in2.pdf into a new PDF, out1.pdf
     pdftk in1.pdf in2.pdf cat output out1.pdf
     or (using handles):
     pdftk A=in1.pdf B=in2.pdf cat A B output out1.pdf
     or (using wildcards):
     pdftk *.pdf cat output combined.pdf

   Remove page 13 from in1.pdf to create out1.pdf
     pdftk in.pdf cat 1-12 14-end output out1.pdf
     or:
     pdftk A=in1.pdf cat A1-12 A14-end output out1.pdf

   Burst a single PDF document into pages and dump its data to
   doc_data.txt
     pdftk in.pdf burst

   Rotate the first PDF page to 90 degrees clockwise
     pdftk in.pdf cat 1east 2-end output out.pdf

   Rotate an entire PDF document to 180 degrees
     pdftk in.pdf cat 1-endsouth output out.pdf

Dans votre cas, je ferais:

     pdftk A=input.pdf cat A<page_range> output output.pdf
Andrzej Pronobis
la source
Le package 'pdftk' n'a pas de candidat d'installation.
FireInTheSky
8

Avez-vous essayé PDF Mod?

Vous pouvez par exemple .. extraire des pages et les enregistrer au format PDF.

La description:

PDF Mod est un outil simple pour modifier des documents PDF. Il peut faire pivoter, extraire, supprimer
et réorganiser les pages par glisser-déposer. Plusieurs documents peuvent être combinés par glisser
-déposer. Vous pouvez également modifier le titre, le sujet, l'auteur et les mots-clés d'un
document PDF à l'aide de PDF Mod.

Installer via le centre de logiciel

J'espère que cela vous sera utile.

Regars.

Roman Raguet
la source
OUI, je l’ai effectivement essayé, mais cela ne me permet PAS de sauvegarder une partie de la page, par exemple une parcelle au format PDF ... À moins que je ne voie pas cette option. Cela me permet d'extraire une page entière d'un document, mais ce n'est pas ce que je veux
user72469
Je l'utilise régulièrement, excellent outil! mais j'avais un document d'environ 170 pages que pdfmod ne pouvait pas manipuler.
loved.by.Jesus
Sensationnel. C'est étonnamment lisse. J'ai jeté mon vrai livre de 512 pages (50 Mo) et c'était ... rapide. L'interface utilisateur est un jeu d'enfant. Pour un junkie CLI comme moi, il faut un certain niveau d’interface graphique pour me convaincre, mais ça ira!
Voir
PDF Mod a des bugs en cours dans Kubuntu 18
Joshua Salazar
8

J'essayais de faire la même chose. Tout ce que tu dois faire est:

  1. installer pdftk:

    sudo apt-get install pdftk
    
  2. si vous voulez extraire des pages aléatoires:

    pdftk myoldfile.pdf cat 1 2 4 5 output mynewfile.pdf
    
  3. si vous voulez extraire une plage:

    pdftk myoldfile.pdf cat 1-2 4-5 output mynewfile.pdf
    

S'il vous plaît vérifier la source pour plus d'infos.

le code
la source
Je trouve cette réponse meilleure car elle montre comment vous pouvez entrer plusieurs plages.
Roman Luštrik
6

En fin de compte, je peux le faire avec imagemagick. Si vous ne l'avez pas, installez simplement avec:

sudo apt-get install imagemagick

Note 1 : J'ai essayé ceci avec un pdf d'une page (j'apprends à utiliser imagemagick, je ne voulais donc pas avoir plus de problèmes que nécessaire). Je ne sais pas si / comment cela fonctionnera avec plusieurs pages, mais vous pouvez extraire une page d'intérêt avec pdftk:

pdftk A=myfile.pdf cat A1 output page1.pdf

où vous indiquez le numéro de page à fractionner (dans l'exemple ci-dessus, A1sélectionne la première page).

Remarque 2 : L'image obtenue à l'aide de cette procédure sera un raster.


Ouvrez le pdf avec la commande display, qui fait partie de la imagemagicksuite:

display file.pdf

Le mien ressemblait à ceci:

affichage imagemagick d'un pdf
Cliquez sur l'image pour voir une version pleine résolution

Maintenant, vous cliquez sur la fenêtre et un menu apparaîtra sur le côté. Là, sélectionnez Transformer | Récolte .

imagemagick transformer> recadrer le menu

De retour dans la fenêtre principale, vous pouvez sélectionner la zone que vous souhaitez rogner en faisant simplement glisser le pointeur (sélection classique d'un coin à l'autre).

sélection de la zone à recadrer
Notez le pointeur en forme de main autour de l'image lorsque vous sélectionnez

Cette sélection peut être affinée avant de passer à l'étape suivante.

Une fois que vous avez terminé, notez le petit rectangle qui apparaît dans le coin supérieur gauche (voir l'image ci-dessus). Il affiche les dimensions de la zone sélectionnée en premier (par exemple 281x218) et en second lieu les coordonnées du premier coin (par exemple +256+215).

Notez les dimensions de la zone sélectionnée. vous en aurez besoin au moment de l'enregistrement de l'image recadrée.

Maintenant, dans le menu contextuel (qui est maintenant le menu spécifique "recadrer"), cliquez sur le bouton Recadrer .

menu de recadrage imagemagick

Enfin, une fois que vous êtes satisfait des résultats du recadrage, cliquez sur le menu Fichier | sauver

Accédez au dossier dans lequel vous souhaitez enregistrer le fichier PDF recadré, saisissez un nom, cliquez sur le bouton Format , dans la fenêtre "Sélectionner le type de format d'image", sélectionnez PDF et cliquez sur le bouton Sélectionner . De retour dans la fenêtre "Parcourir et sélectionner un fichier", cliquez sur le bouton Enregistrer .

imagemagick enregistrer en pdf

Avant de sauvegarder, il vous imagemagicksera demandé de "sélectionner la géométrie de la page". Ici, vous tapez les dimensions de votre image recadrée, en utilisant une simple lettre "x" pour séparer la largeur et la hauteur.

imagemagick sélectionne la géométrie de la page

Maintenant, vous pouvez faire tout cela parfaitement à partir de la ligne de commande (la commande est convertavec option -crop) - c'est sûrement plus rapide, mais vous devez connaître à l'avance les coordonnées de l'image que vous voulez extraire. Vérifiez man convertet un exemple dans leur page Web .

Carnendil
la source
Je ne connaissais pas l'interface graphique d'Imagemagick. Semble intéressant. Cependant, corrigez-moi si je me trompe, mais je pense que imagemagick ne peut pas gérer les images vectorisées. Donc, ce que vous exportez sera probablement une image raster / bitmap uniquement. Dans ce cas, cette méthode revient à prendre une capture d’écran d’une région du document.
Glutanimate
1
En effet, imagemagickne fonctionne que des images raster et displayn’est qu’une des commandes de la suite. Il existe de nombreuses interfaces pour imagemagick- consultez leur page Web. Pour les images vectorielles, la meilleure solution est, je pense, votre méthode avec Inkscape.
carnendil
2
Vous voudrez peut-être ajouter une clause de non-responsabilité en haut de la réponse pour vous avertir que cela convertira les vecteurs en graphiques raster. Cette propriété en fait une approche fondamentalement différente.
bluenote10
2

PDF Split and Merge est très utile pour cela et d'autres opérations de manipulation de PDF.

Télécharger à partir d' ici

Faire
la source
1
Vous pouvez télécharger la dernière version à partir du lien ci-dessus, mais si vous préférez la commodité du Centre de logiciel, vous pouvez également l'installer à partir de celui-ci (ou du terminal, via sudo apt-get install pdfsam). Cependant, la version dans Ubuntu est assez obsolète, car elle est toujours dans la version 1.1.4 alors que la version sourceforge est déjà 2.2.2.
Waldir Leoncio
La dernière version 3.x (actuellement la version 3.1.0) contient un paquet .deb qui peut être installé sur Ubuntu et un module Extract Pages qui remplit les fonctions demandées par l'OP
Andrea Vacondio
1
@Andrea Vacondio Bravo pour votre excellent montage! Vous contribuez à la sécurité d'Internet. J'ai découvert que le fichier de l'ancien lien sur sourceforge.net contient de la merde. Les nouveaux propriétaires du site Web SourceForge ont déclaré qu'ils allaient arrêter de le faire, mais ils ont évidemment menti.
Karel
2

Comme l'utilisateur d'origine a demandé un outil interactif et non un outil de ligne de commande: une solution simple consiste à utiliser n'importe quel visualiseur PDF (okular sur Kubuntu, evince ou même Firefox sur Ubuntu), puis d'utiliser simplement la boîte de dialogue d'impression standard, choisissez "print to Fichier PDF ", puis sélectionnez dans la boîte de dialogue des paramètres étendus les pages à" imprimer ". Cette variante présente certains inconvénients, car certains gadgets du PDF original (tels que des pages pivotées, des formulaires, etc.) peuvent être perdus, mais cela fonctionne directement pour la plupart des PDF simples.

Kai Petzke
la source
0

Si vous souhaitez extraire de vos PDF, vous pouvez utiliser http://www.sumnotes.net . C'est un outil extraordinaire pour extraire des notes, des surlignages et des images à partir de fichiers PDF. Vous pouvez également visionner des tutoriels sur Youtube en les tapant sumnotes.

Je espère que vous apprécierez!

James
la source