Comment puis-je obtenir le nombre de valeurs manquantes dans chaque ligne dans la trame de données Pandas. Je voudrais diviser la trame de données en différentes trames de données qui ont le même nombre de valeurs manquantes dans chaque ligne.
Toute suggestion?
Lors de l' utilisation pandas géants, essayez d'éviter d'effectuer des opérations dans une boucle, y compris
apply
,map
,applymap
etc. C'est lent!Si vous souhaitez compter les valeurs manquantes dans chaque colonne, essayez:
df.isnull().sum()
oudf.isnull().sum(axis=0)
D'un autre côté, vous pouvez compter dans chaque ligne (ce qui est votre question) en:
df.isnull().sum(axis=1)
C'est environ 10 fois plus rapide que la solution de Jan van der Vegt (BTW il compte des valeurs valides plutôt que des valeurs manquantes):
la source
La manière simpliste:
la source
Ou, vous pouvez simplement utiliser la méthode info pour les objets de trame de données:
qui fournit le nombre de valeurs non nulles pour chaque colonne.
la source
des valeurs nulles le long de la colonne,
des valeurs vides le long de la colonne,
des valeurs nulles le long de la ligne,
des valeurs vides le long de la ligne,
la source
Cet extrait renvoie la valeur entière du nombre total de colonnes avec une valeur manquante:
la source
la source
Si vous voulez compter les valeurs manquantes:
la source