Je voudrais supprimer toutes les lignes contenant des valeurs NaN appartenant à une colonne. Supposons que j'ai un ensemble de données comme celui-ci:
Age Height Weight Gender
12 5'7 NaN M
NaN 5'8 160 M
32 5'5 165 NaN
21 NaN 155 F
55 5'10 170 NaN
Je veux supprimer toutes les lignes où 'Gender' a des valeurs NaN. La sortie que j'aimerais:
Age Height Weight Gender
12 5'7 NaN M
NaN 5'8 160 M
21 NaN 155 F
Merci d'avance!
machine-learning
python
data-cleaning
data
uharsha33
la source
la source
Réponses:
Eh bien, si l'ensemble de données n'est pas trop volumineux, je suggère d'utiliser des pandas pour nettoyer les données. Vous devez donc d'abord faire
Python2
Python3
Si anaconda est déjà installé, vous pouvez ignorer l'étape ci-dessus. Ensuite, vous pouvez passer par un IDE (comme jupyter) ou par le shell, tapez les commandes suivantes
Ensuite, vous souhaitez enregistrer votre résultat dans un fichier avec
la source
Si vous travaillez sur Python Dataframe, veuillez essayer ceci.
Ou vous pouvez utiliser notnull au lieu de isfinite.
la source