existe-t-il un outil de rangement des données pour python / pandas similaire à l'outil tidyr R?

18

Je travaille sur un défi Kaggle où certaines variables sont représentées par des lignes au lieu de colonnes (Telstra Network Disruption). Je suis actuellement à la recherche de l'équivalent de recueillir (), séparé () et réparti (), qui peut être trouvé dans l'outil R tidyr.

cpumar
la source

Réponses:

3

Les R gather()vont essentiellement de large à long. Donc,

  1. consultez la page pandas pour savoir comment l'utiliser pandas.wide_to_long(),
  2. consultez ce blog pour une discussion sur l'obtention d'une gatherfonction élégante en Python.
ximiki
la source
0

J'ai essayé d'imiter syntaxiquement le paquet tidyr en python dans un paquet appelé tidypython. Je l'ai rendu compatible avec le package dplython, qui inclut l'utilisation de l'opérateur >> pour chaîner les commandes.

Il n'a pas été entièrement testé, mais devrait fonctionner plutôt bien:

https://github.com/durrantmm/tidypython

Dites-moi si cela marche pour vous.

Matt Durrant
la source