documentation de rééchantillonnage pandas

184

Je comprends donc parfaitement comment utiliser le rééchantillonnage , mais la documentation ne fait pas un bon travail pour expliquer les options.

La plupart des options de la resamplefonction sont donc assez simples, à l'exception de ces deux:

  • règle: la chaîne de décalage ou l'objet représentant la conversion cible
  • comment: chaîne, méthode de sous-échantillonnage ou de rééchantillonnage, par défaut «signifie»

Donc, en regardant autant d'exemples que j'ai trouvé en ligne, je peux voir une règle que vous pouvez faire 'D'pendant une journée, 'xMin'pendant des minutes, 'xL'pendant des millisecondes, mais c'est tout ce que j'ai pu trouver.

la façon dont je l' ai vu ce qui suit: 'first', np.max, 'last', 'mean'et 'n1n2n3n4...nx'où nx est la première lettre de chaque index de colonne.

Alors, y a-t-il quelque part dans la documentation qui me manque qui affiche chaque option pour pandas.resamplela règle de s et comment les entrées? Si oui, où parce que je n'ai pas pu le trouver. Si non, quelles sont toutes les options pour eux?

Ryan Saxe
la source
8
Pour les vagabonds de Google, pour le rééchantillonnage à l'aide de how='last'et how='first': n'oubliez pas d'ajouter closed='left', label='left'. lien
Nasser Al-Wohaibi
@ NasserAl-Wohaibi Je suis assez convaincu que votre commentaire ci-dessus indique que ces options peuvent aider à répondre pleinement à la question suivante. Avez-vous déjà rencontré ce problème? stackoverflow.com/questions/26247301/…
Amelio Vazquez-Reina
how = 'last' est obsolète maintenant en faveur deresample(...).last()
shadi

Réponses:

314
B         business day frequency
C         custom business day frequency (experimental)
D         calendar day frequency
W         weekly frequency
M         month end frequency
SM        semi-month end frequency (15th and end of month)
BM        business month end frequency
CBM       custom business month end frequency
MS        month start frequency
SMS       semi-month start frequency (1st and 15th)
BMS       business month start frequency
CBMS      custom business month start frequency
Q         quarter end frequency
BQ        business quarter endfrequency
QS        quarter start frequency
BQS       business quarter start frequency
A         year end frequency
BA, BY    business year end frequency
AS, YS    year start frequency
BAS, BYS  business year start frequency
BH        business hour frequency
H         hourly frequency
T, min    minutely frequency
S         secondly frequency
L, ms     milliseconds
U, us     microseconds
N         nanoseconds

Consultez la documentation des séries chronologiques . Il comprend une liste de décalages (et de décalages «ancrés» ) et une section sur le rééchantillonnage .

Notez qu'il n'y a pas de liste de toutes les différentes howoptions, car il peut s'agir de n'importe quelle fonction de tableau NumPy et toute fonction disponible via la distribution groupby peut être transmise howpar nom.

Matti John
la source
1
"... parce que cela peut être n'importe quelle fonction de tableau NumPy et ..." - ouais, je l'ai lu dans la documentation, mais y a-t-il une documentation expliquant ce que cette fonction est censée faire exactement et ce qu'elle a à voir avec le rééchantillonnage ...? Je me sens assez perdu ici.
jhin
1
Cela devrait être lié dans tous les domaines de documentation pertinents, comme le rééchantillonnage. Voici le lien vers les abréviations: pandas.pydata.org/pandas-docs/stable/…
wordsforthewise
Ajout d'une pull request pour améliorer la documentation github.com/pandas-dev/pandas/pull/30252
Aseem Bansal
65

Il y a plus que cela, mais vous recherchez probablement cette liste:

B   business day frequency
C   custom business day frequency (experimental)
D   calendar day frequency
W   weekly frequency
M   month end frequency
BM  business month end frequency
MS  month start frequency
BMS business month start frequency
Q   quarter end frequency
BQ  business quarter endfrequency
QS  quarter start frequency
BQS business quarter start frequency
A   year end frequency
BA  business year end frequency
AS  year start frequency
BAS business year start frequency
H   hourly frequency
T   minutely frequency
S   secondly frequency
L   milliseconds
U   microseconds

Source: http://pandas.pydata.org/pandas-docs/stable/timeseries.html#offset-aliases

vonkohorn
la source
8
Pourquoi n'y a-t-il pas le «Min» (comme le «5Min» utilisé dans la documentation)?
ziyuang
@zyuang, seuls les formats courts sont affichés ici: "ms" est également absent de la liste par exemple
Julien__