Panda ricampiona la documentazione


184

Quindi capisco perfettamente come usare resample , ma la documentazione non fa un buon lavoro spiegando le opzioni.

Quindi la maggior parte delle opzioni nella resamplefunzione sono piuttosto semplici tranne per questi due:

  • regola: la stringa di offset o l'oggetto che rappresenta la conversione target
  • come: stringa, metodo per il campionamento verso il basso o il ricampionamento, impostazione predefinita su "media"

Quindi, guardando tutti gli esempi che ho trovato online, posso vedere le regole che puoi fare 'D'per giorno, 'xMin'per minuti, 'xL'per millisecondi, ma questo è tutto ciò che sono riuscito a trovare.

per come ho visto quanto segue: 'first', np.max, 'last', 'mean', e 'n1n2n3n4...nx'dove nx è la prima lettera di ogni indice della colonna.

Quindi c'è qualche parte nella documentazione che mi manca che mostra tutte le opzioni per pandas.resamplela regola e come input? Se sì, dove perché non sono riuscito a trovarlo. Se no, quali sono tutte le opzioni per loro?


8
Per i girovaghi di Google, per il ricampionamento usando how='last'e how='first': non dimenticare di aggiungere closed='left', label='left'. link
Nasser Al-Wohaibi,

@ NasserAl-Wohaibi Sono abbastanza fiducioso che il tuo commento sopra sia un'indicazione che queste opzioni possono aiutare a rispondere pienamente alla seguente domanda. Hai riscontrato questo problema prima? stackoverflow.com/questions/26247301/…
Amelio Vazquez-Reina

how = 'last' è ora deprecato in favore diresample(...).last()
shadi

Risposte:


314
B         business day frequency
C         custom business day frequency (experimental)
D         calendar day frequency
W         weekly frequency
M         month end frequency
SM        semi-month end frequency (15th and end of month)
BM        business month end frequency
CBM       custom business month end frequency
MS        month start frequency
SMS       semi-month start frequency (1st and 15th)
BMS       business month start frequency
CBMS      custom business month start frequency
Q         quarter end frequency
BQ        business quarter endfrequency
QS        quarter start frequency
BQS       business quarter start frequency
A         year end frequency
BA, BY    business year end frequency
AS, YS    year start frequency
BAS, BYS  business year start frequency
BH        business hour frequency
H         hourly frequency
T, min    minutely frequency
S         secondly frequency
L, ms     milliseconds
U, us     microseconds
N         nanoseconds

Vedi la documentazione della timeseries . Include un elenco di offset (e offset "ancorati" ) e una sezione sul ricampionamento .

Si noti che non esiste un elenco di tutte le diverse howopzioni, poiché può essere qualsiasi funzione dell'array NumPy e qualsiasi funzione disponibile tramite invio tramite groupby può essere passata per hownome.


1
"... perché può essere qualsiasi funzione dell'array NumPy e ..." - sì, l'ho letto nei documenti, ma c'è qualche documentazione che spiega esattamente cosa dovrebbe fare questa funzione e cosa ha a che fare con ricampionamento ...? Mi sento abbastanza perso qui.
jhin

1
Questo dovrebbe essere collegato a tutte le aree di documentazione rilevanti, come il ricampionamento. Ecco il link alle abbreviazioni: pandas.pydata.org/pandas-docs/stable/…
wordsforthewise

Aggiunta una richiesta pull per migliorare la documentazione github.com/pandas-dev/pandas/pull/30252
Aseem Bansal

65

C'è di più, ma probabilmente stai cercando questo elenco:

B   business day frequency
C   custom business day frequency (experimental)
D   calendar day frequency
W   weekly frequency
M   month end frequency
BM  business month end frequency
MS  month start frequency
BMS business month start frequency
Q   quarter end frequency
BQ  business quarter endfrequency
QS  quarter start frequency
BQS business quarter start frequency
A   year end frequency
BA  business year end frequency
AS  year start frequency
BAS business year start frequency
H   hourly frequency
T   minutely frequency
S   secondly frequency
L   milliseconds
U   microseconds

Fonte: http://pandas.pydata.org/pandas-docs/stable/timeseries.html#offset-aliases


8
Perché non c'è il 'Min' (come il '5Min' usato nella documentazione)?
ziyuang,

@zyuang, qui vengono visualizzati solo i formati brevi: "ms" è assente dall'elenco, ad esempio
Julien__
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.