Sembrano entrambi estremamente simili e sono curioso di sapere quale pacchetto sarebbe più vantaggioso per l'analisi dei dati finanziari.
Sembrano entrambi estremamente simili e sono curioso di sapere quale pacchetto sarebbe più vantaggioso per l'analisi dei dati finanziari.
Risposte:
Panda fornisce strumenti di manipolazione dei dati di alto livello basati su NumPy. NumPy da solo è uno strumento di livello abbastanza basso, simile a MATLAB. i panda invece offrono funzionalità di serie storiche, allineamento dei dati, statistiche NA-friendly, metodi di raggruppamento, unione e unione e molte altre comodità. È diventato molto popolare negli ultimi anni nelle applicazioni finanziarie. Avrò un capitolo dedicato all'analisi dei dati finanziari usando i panda nel mio prossimo libro.
NA-friendly statistics
, menzionato nella tua risposta.
Numpy è richiesto dai panda (e praticamente da tutti gli strumenti numerici per Python). Scipy non è strettamente richiesto per i panda ma è elencato come "dipendenza opzionale". Non direi che i panda siano un'alternativa a Numpy e / o Scipy. Piuttosto, è uno strumento aggiuntivo che fornisce un modo più semplificato di lavorare con dati numerici e tabulari in Python. Puoi usare le strutture dati di Panda ma attingere liberamente alle funzioni di Numpy e Scipy per manipolarle.
I panda offrono un ottimo modo per manipolare le tabelle, in quanto è possibile semplificare il binning ( binning di un frame di dati in Panda in Python ) e calcolare le statistiche. Un'altra cosa fantastica nei panda è la classe Panel che puoi unire serie di livelli con proprietà diverse e combinarla usando la funzione groupby.