Un mio amico ha suggerito che l'industria del software ha bisogno principalmente di "big data", non di statistiche.
Pur essendo parzialmente d'accordo con il commento del tuo amico, vorrei sottolineare che in qualsiasi settore, gli strumenti per i Big Data sono attivati, solo se tutte le V sono soddisfatte.
Lavoro come responsabile della scienza dei dati presso una delle principali società di assistenza clienti. Qui, faccio hacking di dati sia per il prodotto che per la crescita dell'azienda.
Uso principalmente tecniche di analisi di serie storiche per la previsione di churn e l'analisi delle vendite. Ciò include anche l'analisi comportamentale dei clienti, della concorrenza e del settore.
Dal lato del prodotto, utilizziamo una serie di tecniche a partire dall'analisi del sentiment utilizzando LSTM, algoritmi di raccomandazione, ecc.
Ma il focus principale è sull'analisi delle serie storiche. Il flusso di lavoro generale sarebbe:
- Pulizia e stampaggio dei dati.
- le analisi esplorative ed esplicative che comportano l'identificazione di stagionalità, tendenze e cicli. Pertanto, è necessario esplorare correlazioni, autocorrelazioni e diverse statistiche univariate e bivariate; insieme a numerosi grafici, tra cui le curve scatter, AFC, PAFC.
- Ora arriva la parte di previsione, in cui vari modelli vengono testati a vicenda, prendendo in seria considerazione il passaggio 2.
Strumenti usati da me: R, Python ed Excel a volte.
E anche la miscela di scienza dei dati e hacking sulla crescita ha dimostrato di fare magie nel campo del marketing. Quindi, la domanda di statistici e nerd matematici rimarrebbe così com'è; e non declinerà da nessuna parte nel prossimo futuro; soprattutto quando le startup focalizzate sul cliente stanno fiorendo in tutto il mondo.