Lors de l'utilisation wget
dans un script pour télécharger des fichiers à partir de Google Docs, le nom du fichier n'est pas conservé. Par exemple:
wget 'http://spreadsheets.google.com/pub?key=pyj6tScZqmEfbZyl0qjbiRQ&output=xls'
enregistre le fichier au pub?key=pyj6tScZqmEfbZyl0qjbiRQ
lieu de indicatorhivestimatedprevalence15-49.xls
, ce que je reçois si je clique sur le lien dans un navigateur. Existe-t-il un moyen d'imposer ce comportement de type "navigateur" wget
?
Vous pouvez essayer d'utiliser curl pour télécharger et conserver le nom de fichier d'origine:
voir les options de la ligne de commande curl .
la source
Le lien Google Documents indique en réalité à un script sur le serveur de s'exécuter, en l'analysant dans le fichier souhaité. À ma connaissance, le fichier n'existe pas encore sur le serveur sous la forme els, mais il est généré au moment de l'exécution lorsque vous le demandez. Ainsi, il n'y a rien pour wget à obtenir.
Pour télécharger le fichier, vous devez utiliser l'API Google http://code.google.com/apis/documents/docs/3.0/developers_guide_protocol.html#DownloadingDocs/ .
la source
.xls
fichier à la volée. Cependant, un navigateur complet n’a aucun problème avec cela. Il est donc évidemment possible de se passer de l'API Docs.