Je suis toujours un débutant apprenant de Hadoop, et cette fois, j'essayais de traiter un fichier de 106 Go. J'avais l'habitude -copyFromLocal
de copier ce gros fichier sur mon Hadoop DFS, mais comme le fichier est gros, je dois attendre longtemps sans avoir la moindre idée de l'état de copie actuel.
Existe-t-il un moyen d'afficher l'état de copie de fichier actuel avec cette commande?
Merci d'avance pour votre aide!
Il est également possible de suivre la progression de la lecture du fichier local à l'aide de la
pv
commande et de diriger le contenu du fichier vershdfs dfs
stdin:pv mylargefile.txt | hdfs dfs -put - /path/to/file/on/hdfs/mylargefile.txt
la source
pv
est un tel outil sous-évalué OMI. Fait parfaitement le travail ici.Il ne semble pas y avoir d'option verbeuse à aucune des commandes de copie (copyFromLocal, copyToLocal, get, put). Votre meilleur pari est probablement de regarder la taille du fichier à sa destination sur HDFS afin de mesurer sa progression.
la source
Vous pouvez utiliser "nohup &" pour exécuter la copie en arrière-plan. nohup fera exécuter le processus même après vous être déconnecté du serveur. Lorsque vous en avez besoin, vous pouvez vérifier le processus à l'aide de "hadoop fs -ls.
la source