La trama delle serie temporali di Pandas imposta le tacche e le etichette principali e secondarie dell'asse x


87

Voglio essere in grado di impostare gli xtick maggiore e minore e le loro etichette per un grafico di serie temporali tracciato da un oggetto serie temporale di Pandas.

La pagina "Novità" di Pandas 0.9 dice:

"puoi utilizzare to_pydatetime o registrare un convertitore per il tipo Timestamp"

ma non riesco a capire come farlo in modo da poter usare i comandi matplotlib ax.xaxis.set_major_locatore ax.xaxis.set_major_formatter(e minori).

Se li uso senza convertire i tempi dei panda, i segni di spunta e le etichette dell'asse x finiscono per essere sbagliati.

Utilizzando il parametro "xticks" posso passare i tick principali a pandas.plot, quindi impostare le etichette dei tick principali. Non riesco a capire come eseguire le zecche minori usando questo approccio. (Posso impostare le etichette sui tick minori predefiniti impostati da pandas.plot)

Ecco il mio codice di prova:

import pandas
print 'pandas.__version__ is ', pandas.__version__
print 'matplotlib.__version__ is ', matplotlib.__version__    

dStart = datetime.datetime(2011,5,1) # 1 May
dEnd = datetime.datetime(2011,7,1) # 1 July    

dateIndex = pandas.date_range(start=dStart, end=dEnd, freq='D')
print "1 May to 1 July 2011", dateIndex      

testSeries = pandas.Series(data=np.random.randn(len(dateIndex)),
                           index=dateIndex)    

ax = plt.figure(figsize=(7,4), dpi=300).add_subplot(111)
testSeries.plot(ax=ax, style='v-', label='first line')    

# using MatPlotLib date time locators and formatters doesn't work with new
# pandas datetime index
ax.xaxis.set_minor_locator(matplotlib.dates.WeekdayLocator(byweekday=(1),
                                                           interval=1))
ax.xaxis.set_minor_formatter(matplotlib.dates.DateFormatter('%d\n%a'))
ax.xaxis.grid(True, which="minor")
ax.xaxis.grid(False, which="major")
ax.xaxis.set_major_formatter(matplotlib.dates.DateFormatter('\n\n\n%b%Y'))
plt.show()    

# set the major xticks and labels through pandas
ax2 = plt.figure(figsize=(7,4), dpi=300).add_subplot(111)
xticks = pandas.date_range(start=dStart, end=dEnd, freq='W-Tue')
print "xticks: ", xticks
testSeries.plot(ax=ax2, style='-v', label='second line',
                xticks=xticks.to_pydatetime())
ax2.set_xticklabels([x.strftime('%a\n%d\n%h\n%Y') for x in xticks]);
# set the text of the first few minor ticks created by pandas.plot
#    ax2.set_xticklabels(['a','b','c','d','e'], minor=True)
# remove the minor xtick labels set by pandas.plot 
ax2.set_xticklabels([], minor=True)
# turn the minor ticks created by pandas.plot off 
# plt.minorticks_off()
plt.show()
print testSeries['6/4/2011':'6/7/2011']

e il suo output:

pandas.__version__ is  0.9.1.dev-3de54ae
matplotlib.__version__ is  1.1.1
1 May to 1 July 2011 <class 'pandas.tseries.index.DatetimeIndex'>
[2011-05-01 00:00:00, ..., 2011-07-01 00:00:00]
Length: 62, Freq: D, Timezone: None

Grafico con date strane sull'asse x

xticks:  <class 'pandas.tseries.index.DatetimeIndex'>
[2011-05-03 00:00:00, ..., 2011-06-28 00:00:00]
Length: 9, Freq: W-TUE, Timezone: None

Grafico con date corrette

2011-06-04   -0.199393
2011-06-05   -0.043118
2011-06-06    0.477771
2011-06-07   -0.033207
Freq: D

Aggiornamento: sono stato in grado di avvicinarmi al layout che volevo utilizzando un ciclo per costruire le principali etichette xtick:

# only show month for first label in month
month = dStart.month - 1
xticklabels = []
for x in xticks:
    if  month != x.month :
        xticklabels.append(x.strftime('%d\n%a\n%h'))
        month = x.month
    else:
        xticklabels.append(x.strftime('%d\n%a'))

Tuttavia, questo è un po 'come fare l'asse x usando ax.annotate: possibile ma non ideale.


1
So che questo non risponde davvero alla domanda, ma come approccio generale quando mi interessa davvero l'aspetto di una trama, in genere cerco solo di ottenerne una versione vettoriale e renderla piacevole in Illustrator o Inkscape. Ho scoperto che molte altre persone che conosco sembrano fare lo stesso.
John McDonnell

2
Puoi semplicemente ignorare completamente gli argomenti della plotfunzione panda e impostare tutti i segni di graduazione dopo la stampa, utilizzando i metodi matplotlib axdell'oggetto restituito (ad esempio ax.set_xticks)?
BrenBarn

@BrenBarn non sono riuscito a capire come ottenere la data come una data python invece di un datetime panda per i metodi matplotlib. La risposta di bmu lo risolve convertendo le date prima della stampa.
brenda

Risposte:


89

Entrambi pandase da matplotlib.datesusare matplotlib.unitsper localizzare le zecche.

Ma sebbene matplotlib.datesabbia modi convenienti per impostare manualmente i segni di spunta, i panda sembrano concentrarsi sulla formattazione automatica finora (puoi dare un'occhiata al codice per la conversione della data e la formattazione nei panda).

Quindi per il momento sembra più ragionevole da usare matplotlib.dates(come menzionato da @BrenBarn nel suo commento).

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt 
import matplotlib.dates as dates

idx = pd.date_range('2011-05-01', '2011-07-01')
s = pd.Series(np.random.randn(len(idx)), index=idx)

fig, ax = plt.subplots()
ax.plot_date(idx.to_pydatetime(), s, 'v-')
ax.xaxis.set_minor_locator(dates.WeekdayLocator(byweekday=(1),
                                                interval=1))
ax.xaxis.set_minor_formatter(dates.DateFormatter('%d\n%a'))
ax.xaxis.grid(True, which="minor")
ax.yaxis.grid()
ax.xaxis.set_major_locator(dates.MonthLocator())
ax.xaxis.set_major_formatter(dates.DateFormatter('\n\n\n%b\n%Y'))
plt.tight_layout()
plt.show()

pandas_like_date_fomatting

(la mia lingua è tedesca, quindi martedì [Tue] diventa Dienstag [Di])

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.