J'ai un dataframe composé de centaines de colonnes, et j'ai besoin de voir tous les noms de colonnes.
Ce que j'ai fait:
In[37]:
data_all2.columns
La sortie est:
Out[37]:
Index(['customer_id', 'incoming', 'outgoing', 'awan', 'bank', 'family', 'food',
'government', 'internet', 'isipulsa',
...
'overdue_3months_feature78', 'overdue_3months_feature79',
'overdue_3months_feature80', 'overdue_3months_feature81',
'overdue_3months_feature82', 'overdue_3months_feature83',
'overdue_3months_feature84', 'overdue_3months_feature85',
'overdue_3months_feature86', 'loan_overdue_3months_total_y'],
dtype='object', length=102)
Comment afficher toutes les colonnes au lieu d'une liste tronquée?
Pour obtenir tous les noms de colonne d'un DataFrame,
df_data
dans cet exemple, il vous suffit d'utiliser la commandedf_data.columns.values
. Cela vous montrera une liste avec tous les noms de colonnes de votre DataframeCode:
Production:
la source
Dans la console interactive, c'est facile à faire:
Ou ceci dans un script:
la source
Ça fera l'affaire. Notez l'utilisation de
display()
au lieu d'imprimer.ÉDITER:
L'utilisation de
display
est obligatoire car lespd.option_context
paramètres s'appliquent uniquement àdisplay
et non àprint
.la source
with
mot - clé pour appliquer l'option uniquement au bloc ci-dessous. Cependant, cela fonctionne bien avecprint()
. Pourquoi aurais-je besoin d'utiliser à ladisplay()
place deprint()
?Ce qui a fonctionné pour moi était le suivant:
Vous pouvez également le définir sur un entier supérieur à votre nombre de colonnes.
la source
Pour obtenir tous les noms de colonnes, vous pouvez parcourir le
data_all2.columns
.Vous obtiendrez tous les noms de colonnes. Ou vous pouvez stocker tous les noms de colonne dans une autre variable de liste, puis imprimer la liste.
la source
Si vous voulez juste voir toutes les colonnes, vous pouvez faire quelque chose de ce genre comme solution rapide
maintenant cols se comportera comme une variable itérative qui peut être indexée. par exemple
la source
Une solution rapide et sale serait de le convertir en chaîne
les ferait tous être imprimés séparés par des tabulations Bien sûr, notez qu'avec 102 noms, tous assez longs, ce sera un peu difficile à lire
la source
J'avais beaucoup de noms de colonnes en double, et une fois que j'ai couru
J'ai pu voir la liste complète des colonnes
Crédit: https://stackoverflow.com/a/40435354/5846417
la source
tu peux essayer ça
la source
Ce n'est pas une réponse conventionnelle, mais je suppose que vous pouvez transposer le dataframe pour regarder les lignes au lieu des colonnes. J'utilise ceci parce que je trouve que regarder les lignes est plus `` intuitif '' que regarder les colonnes:
Cela devrait vous permettre de visualiser toutes les lignes. Cette action n'est pas permanente , elle vous permet simplement de visualiser la version transposée du dataframe.
Si les lignes sont toujours tronquées, utilisez simplement
print(data_all2.T)
pour tout afficher.la source
Le moyen le plus simple que j'ai trouvé est juste
Personnellement, je ne voudrais pas changer les globaux, ce n'est pas si souvent que je veux voir tous les noms de colonnes.
la source
C'est mon chemin. Je n'essaye jamais de cent colonnes. Mais je pense que ça marche
la source
Je sais que c'est une répétition mais je finis toujours par copier-coller et modifier la réponse de YOLO:
la source