Non sono sicuro di dove appartenga questa domanda: Cross Validated o The Workplace. Ma la mia domanda è vagamente correlata alle statistiche.
Questa domanda (o immagino domande) è nata durante il mio lavoro come "stagista di scienza dei dati". Stavo costruendo questo modello di regressione lineare ed esaminando la trama residua. Ho visto un chiaro segno di eteroschedasticità. Ricordo che l'eteroschedasticità distorce molte statistiche di test come l'intervallo di confidenza e il test t. Quindi ho usato il quadrato meno ponderato, seguendo quello che ho imparato al college. Il mio manager lo vide e mi consigliò di non farlo perché "stavo rendendo le cose complicate", il che non era affatto una ragione molto convincente per me.
Un altro esempio potrebbe essere "la rimozione di una variabile esplicativa poiché il suo valore p è insignificante". Ad essere, questo consiglio non ha senso da un punto di vista logico. Secondo quanto ho appreso, un valore p insignificante potrebbe essere dovuto a diversi motivi: possibilità, uso del modello sbagliato, violazione delle ipotesi, ecc.
Un altro esempio è che ho usato la validazione incrociata di k-fold per valutare il mio modello. Secondo il risultato, è semplicemente migliore di . Ma abbiamo un inferiore per il modello 1 e la ragione ha qualcosa a che fare con l'intercetta . Il mio supervisore, tuttavia, sembra preferire il modello 2 perché ha più alto . Le sue ragioni (come è solida, o la convalida incrociata è l'approccio all'apprendimento automatico, non l'approccio statistico) non sembrano essere abbastanza convincenti da cambiare idea. C V m o d e l 2 R 2 R 2 R 2
Come qualcuno che si è appena laureato, sono molto confuso. Sono molto appassionato di applicare statistiche corrette per risolvere i problemi del mondo reale, ma non so quale delle seguenti affermazioni sia vera:
- Le statistiche che ho imparato da solo sono sbagliate, quindi sto solo facendo errori.
- C'è un'enorme differenza tra le statistiche teoriche e i modelli di costruzione nelle aziende. E sebbene la teoria della statistica sia corretta, la gente non la segue.
- Il gestore non sta usando correttamente le statistiche.
Aggiornamento al 17/04/2017: ho deciso di perseguire un dottorato di ricerca. nelle statistiche. Grazie a tutti per la risposta.