Je comprends donc parfaitement comment utiliser le rééchantillonnage , mais la documentation ne fait pas un bon travail pour expliquer les options.
La plupart des options de la resample
fonction sont donc assez simples, à l'exception de ces deux:
- règle: la chaîne de décalage ou l'objet représentant la conversion cible
- comment: chaîne, méthode de sous-échantillonnage ou de rééchantillonnage, par défaut «signifie»
Donc, en regardant autant d'exemples que j'ai trouvé en ligne, je peux voir une règle que vous pouvez faire 'D'
pendant une journée, 'xMin'
pendant des minutes, 'xL'
pendant des millisecondes, mais c'est tout ce que j'ai pu trouver.
la façon dont je l' ai vu ce qui suit: 'first'
, np.max
, 'last'
, 'mean'
et 'n1n2n3n4...nx'
où nx est la première lettre de chaque index de colonne.
Alors, y a-t-il quelque part dans la documentation qui me manque qui affiche chaque option pour pandas.resample
la règle de s et comment les entrées? Si oui, où parce que je n'ai pas pu le trouver. Si non, quelles sont toutes les options pour eux?
la source
how='last'
ethow='first'
: n'oubliez pas d'ajouterclosed='left', label='left'
. lienresample(...).last()
Réponses:
Consultez la documentation des séries chronologiques . Il comprend une liste de décalages (et de décalages «ancrés» ) et une section sur le rééchantillonnage .
Notez qu'il n'y a pas de liste de toutes les différentes
how
options, car il peut s'agir de n'importe quelle fonction de tableau NumPy et toute fonction disponible via la distribution groupby peut être transmisehow
par nom.la source
Il y a plus que cela, mais vous recherchez probablement cette liste:
Source: http://pandas.pydata.org/pandas-docs/stable/timeseries.html#offset-aliases
la source