Molte persone usano uno strumento principale come Excel o un altro foglio di calcolo, SPSS, Stata o R per le loro esigenze statistiche. Potrebbero rivolgersi a un pacchetto specifico per esigenze molto speciali, ma molte cose possono essere fatte con un semplice foglio di calcolo o un pacchetto di statistiche generali o un ambiente di programmazione delle statistiche.
Mi è sempre piaciuto Python come linguaggio di programmazione e, per esigenze semplici, è facile scrivere un breve programma che calcola ciò di cui ho bisogno. Matplotlib mi permette di tracciarlo.
Qualcuno è passato completamente, diciamo R, a Python? R (o qualsiasi altro pacchetto di statistiche) ha molte funzionalità specifiche per le statistiche e ha strutture di dati che ti consentono di pensare alle statistiche che desideri eseguire e meno alla rappresentazione interna dei tuoi dati. Python (o qualche altro linguaggio dinamico) ha il vantaggio di consentirmi di programmare in un linguaggio familiare di alto livello e mi permette di interagire a livello di programmazione con i sistemi del mondo reale in cui risiedono i dati o dai quali posso prendere le misure. Ma non ho trovato alcun pacchetto Python che mi permettesse di esprimere le cose con "terminologia statistica" - da semplici statistiche descrittive a metodi multivariati più complicati.
Cosa puoi consigliare se volessi usare Python come "banco di lavoro delle statistiche" per sostituire R, SPSS, ecc.?
Cosa guadagnerei e perderei, in base alla tua esperienza?