In conclusione , più imparo sulle statistiche, meno mi fido degli articoli pubblicati nel mio campo; Credo semplicemente che i ricercatori non stiano facendo abbastanza bene le loro statistiche.
Sono un laico, per così dire. Sono addestrato in biologia ma non ho un'istruzione formale in statistica o matematica. Mi piace R e spesso faccio uno sforzo per leggere (e capire ...) alcune delle basi teoriche dei metodi che applico quando faccio ricerca. Non mi sorprenderebbe se la maggior parte delle persone che eseguono analisi oggi non fossero formalmente formate. Ho pubblicato circa 20 articoli originali, alcuni dei quali sono stati accettati da riviste e statistici noti e sono stati spesso coinvolti nel processo di revisione. Le mie analisi includono comunemente analisi di sopravvivenza, regressione lineare, regressione logistica, modelli misti. Mai un revisore ha mai fatto domande su ipotesi, adattamento o valutazione del modello.
Pertanto, non mi sono mai preoccupato troppo delle ipotesi, dell'adattamento e della valutazione del modello. Comincio con un'ipotesi, eseguo la regressione e quindi presento i risultati. In alcuni casi ho fatto uno sforzo per valutare queste cose, ma ho sempre finito per " bene non ha soddisfatto tutti i presupposti, ma mi fido dei risultati (" conoscenza della materia ") e sono plausibili, quindi va bene " e quando consultavano uno statistico sembravano sempre d'accordo.
Ora, ho parlato con altri statistici e non statistici (chimici, medici e biologi) che eseguono analisi da soli; sembra che le persone non si preoccupino troppo di tutte queste ipotesi e valutazioni formali. Ma qui sul CV, c'è un'abbondanza di persone che chiedono di residui, adattamento del modello, modi per valutarlo, autovalori, vettori e l'elenco continua. Lasciami in questo modo, quando lme4 mette in guardia su autovalori di grandi dimensioni, dubito davvero che molti dei suoi utenti si preoccupino di affrontare ...
Vale la pena lo sforzo extra? Non è probabile che la maggior parte dei risultati pubblicati non rispetti questi presupposti e forse non li abbia nemmeno valutati? Questo è probabilmente un problema crescente dal momento che i database crescono ogni giorno di più e c'è l'idea che più grandi sono i dati, meno importanti sono le ipotesi e le valutazioni.
Potrei sbagliarmi assolutamente, ma è così che l'ho percepito.
Aggiornamento: citazione presa in prestito da StasK (sotto): http://www.nature.com/news/science-joins-push-to-screen-statistics-in-papers-1.15509