J'essaie d'importer un fichier .csv en utilisant pandas.read_csv()
, mais je ne veux pas importer la 2ème ligne du fichier de données (la ligne avec index = 1 pour l'indexation 0).
Je ne vois pas comment ne pas l'importer car les arguments utilisés avec la commande semblent ambigus:
Sur le site Web des pandas:
skiprows
: de type liste ou entierNuméros de ligne à ignorer (indexés à 0) ou nombre de lignes à ignorer (entier) au début du fichier. "
Si je mets skiprows=1
les arguments, comment sait-il s'il faut sauter la première ligne ou sauter la ligne avec l'index 1?
Réponses:
Vous pouvez essayer vous-même:
la source
[]
.from io import StringIO
pd.compat.StringIO
.Je n'ai pas encore la réputation de commenter, mais je veux ajouter à alko la réponse pour référence.
À partir de la documentation :
la source
J'ai eu le même problème en exécutant les skiprows lors de la lecture du fichier csv. Je donnais skip_rows = 1 cela ne fonctionnera pas
Un exemple simple donne une idée de l'utilisation de skiprows lors de la lecture d'un fichier csv.
la source
Toutes ces réponses manquent un point important - la nième ligne est la nième ligne du fichier, et non la nième ligne du jeu de données. J'ai une situation où je télécharge des données désuètes de jauge de flux de l'USGS. La tête de l'ensemble de données est commentée avec '#', la première ligne après cela sont les étiquettes, vient ensuite une ligne qui décrit les types de date et les données elles-mêmes. Je ne sais jamais combien il y a de lignes de commentaires, mais je sais quelles sont les deux premières lignes. Exemple:
Ce serait bien s'il y avait un moyen de sauter automatiquement la nième ligne ainsi que la nième ligne.
En guise de note, j'ai pu résoudre mon problème avec:
la source
skip[1]
sautera la deuxième ligne, pas la première.la source
Aussi assurez - vous que votre fichier est en fait un fichier CSV. Par exemple, si vous aviez un fichier .xls et avez simplement changé l'extension de fichier en .csv, le fichier ne sera pas importé et donnera l'erreur ci-dessus. Pour vérifier si c'est votre problème, ouvrez le fichier dans Excel et il dira probablement:
"Le format de fichier et l'extension de 'Filename.csv' ne correspondent pas. Le fichier est peut-être corrompu ou dangereux. À moins que vous ne fassiez confiance à sa source, ne l'ouvrez pas. Voulez-vous quand même l'ouvrir?"
Pour réparer le fichier: ouvrez le fichier dans Excel, cliquez sur «Enregistrer sous», choisissez le format de fichier sous lequel enregistrer (utilisez .cvs), puis remplacez le fichier existant.
C'était mon problème et j'ai corrigé l'erreur pour moi.
la source