J'ai converti une trame de données pandas en une sortie html en utilisant le DataFrame.to_html
fonction. Lorsque j'enregistre cela dans un fichier html distinct, le fichier affiche une sortie tronquée.
Par exemple, dans ma colonne TEXT,
df.head(1)
montrera
Le film a été un excellent effort ...
au lieu de
Le film a été un excellent effort pour déconstruire les sentiments sociaux complexes qui ont prévalu pendant cette période.
Ce rendu est correct dans le cas d'un format convivial pour un cadre de données pandas massif, mais j'ai besoin d'un fichier html qui montrera les données tabulaires complètes contenues dans le cadre de données, c'est-à-dire quelque chose qui montrera le dernier élément de texte plutôt que le ancien extrait de texte.
Comment pourrais-je afficher les données textuelles complètes et non tronquées pour chaque élément de ma colonne TEXT dans la version html des informations? J'imagine que la table html devrait afficher de longues cellules pour afficher les données complètes, mais pour autant que je comprends, seuls les paramètres de largeur de colonne peuvent être passés dans la DataFrame.to_html
fonction.
None
signifiant illimité.None
. Sinon, obtiendra uneValueError: Value must have type '<class 'int'>'
erreur.max_columns
réponse a fonctionné pour moi, qui utiliseNone
comme deuxième argument deset_option
.with pd.option_context('display.max_colwidth', -1): display(df)
id
(deuxième argument) peut afficher complètement les colonnes.la source
max_colwidth
peut résoudre le problème tronqué causé par un champ contenant des valeurs trop longues. Cependant, je pense que les problèmes tronqués pour la plupart des gens sont en fait trop de colonnes. Donc, cemax_columns
devrait être celui qui est accepté.Alors que
pd.set_option('display.max_columns', None)
définit le nombre de colonnes maximum affichées, l'optionpd.set_option('display.max_colwidth', -1)
définit la largeur maximale de chaque champ unique.Pour mes besoins, j'ai écrit une petite fonction d'aide pour imprimer entièrement d'énormes trames de données sans affecter le reste du code, il reformate également les nombres flottants et définit la largeur d'affichage virtuel. Vous pouvez l'adopter pour vos cas d'utilisation.
la source
Pour ceux qui cherchent à le faire en un rien de temps. Je ne pouvais pas trouver une option similaire dans dask mais si je le fais simplement dans le même cahier pour les pandas, cela fonctionne aussi pour dask.
la source
Le code suivant entraîne l'erreur ci-dessous:
FutureWarning: la transmission d'un entier négatif est déconseillée dans la version 1.0 et ne sera plus prise en charge dans la future version. Utilisez plutôt None pour ne pas limiter la largeur de colonne.
Utilisez plutôt:
Cela accomplit la tâche et est conforme aux versions de pandas suivant la version 1.0.
la source