Quali sono alcuni documenti statistici applicati interessanti e ben scritti?


28

Quali sono alcuni buoni articoli che descrivono applicazioni di statistiche che sarebbero divertenti e istruttive da leggere? Giusto per essere chiari, non sto davvero cercando documenti che descrivono nuovi metodi statistici (ad esempio, un documento sulla regressione dell'angolo minimo), ma piuttosto documenti che descrivono come risolvere i problemi del mondo reale.

Ad esempio, un articolo che si adatterebbe a quello che sto cercando è il documento sul clima del secondo Journal Club convalidato . Sto cercando più articoli statistici, piuttosto che documenti di apprendimento automatico, ma immagino che sia una sorta di distinzione confusa (classificherei gli articoli del Premio Netflix come un po 'borderline e un articolo sull'analisi dei sentimenti come qualcosa sto non cercando).

Lo sto chiedendo perché la maggior parte delle applicazioni di statistiche che ho visto sono o piccoli frammenti che hai visto nei libri di testo o cose relative al mio lavoro, quindi mi piacerebbe ramificarmi un po '.


4
Hai degli interessi generali che vorresti elencare? Ciò potrebbe aiutare a guidare i suggerimenti. Le applicazioni delle statistiche sono diventate piuttosto diffuse in una vasta gamma di campi.
cardinale

1
@ cardinale, no, nessun interesse particolare - lo scopo era quello di ramificarsi dalle cose che leggevo in genere, quindi sto cercando di non limitare le risposte. (Questo forse rende la domanda un po 'troppo ampia, ma immagino che sto cercando le liste "best of" personali delle persone.)
raegtin,

1
Un classico da leggere, soprattutto perché tutti i modelli di probabilità introdotti sono motivati ​​da ragionamenti "fisici" sul problema, piuttosto che tirati fuori da un cappello, è: F. Mosteller, DL Wallace (1963): Inferenza in un problema di paternità: Uno studio comparativo sui metodi di discriminazione applicati alla paternità dei controversi documenti federalisti , J. Am. Statistica. Assoc. 58 (302), pagg. 275–309. Anche a questo link .
pglpm

Risposte:


12

È un po 'difficile per me vedere quale articolo potrebbe interessarti, quindi lasciami provare e suggerire quelli seguenti, dalla letteratura psicometrica:

Borsboom, D. (2006). L'attacco degli psicometrici . Psychometrika , 71 , 425-440.

per vestire la scena (Perché dobbiamo usare modelli statistici che riflettano meglio le ipotesi di base che si trovano comunemente nella ricerca psicologica?) e

Borsboom, D. (2008). Prospettive psicometriche sui sistemi diagnostici . Journal of Clinical Psychology , 64 , 1089-1108.

per una prospettiva applicata sulla medicina diagnostica (passaggio dalla valutazione sì / no utilizzata nel DSM-IV all'approccio "dimensionale" previsto per il DSM-V). Una recensione più ampia di modelli variabili latenti nella ricerca biomedica che mi piace è:

Rabe-Hesketh, S. e Skrondal, A. (2008). Modelli variabili latenti classici per la ricerca medica . Metodi statistici nella ricerca medica , 17 (1) , 5-32.


@ chl (+1) quei documenti di Borsboom sono stati meravigliosi, hanno davvero ampliato il mio pensiero sulla misurazione
richiemorrisroe

+1, mi piace anche Borsboom. Per chi fosse interessato all'articolo The Attack, penso che sarebbe interessato anche a "The Concept of Validity", rhowell.ba.ttu.edu/borsboomValidity2004.pdf . Anche se è un po 'più prolisso, quindi non è facile da seguire come l'articolo di Attack.
Andy W,

10

Ecco cinque articoli molto citati degli ultimi 40 anni del Journal of Royal Statistical Society, Serie C: Statistica applicata con una chiara applicazione nel titolo che ha attirato la mia attenzione durante la scansione dei risultati della ricerca Web of Knowledge:


9

A un livello più ampio, consiglierei il documento ["Statistical Modeling: The Two Cultures"] [1] di Leo Breiman nel 2001 (citato 515). So che è stato recentemente trattato dal journal club e l'ho trovato davvero interessante. Ho scelto l'abstract.

Astratto. Esistono due culture nell'uso della modellistica statistica per trarre conclusioni dai dati. Si presume che i dati siano generati da un dato modello di dati stocastico. L'altro utilizza modelli algoritmici e considera il meccanismo di dati sconosciuto. La comunità statistica è impegnata nell'uso quasi esclusivo dei modelli di dati. Questo impegno ha portato a una teoria irrilevante, a conclusioni discutibili e ha impedito agli statistici di lavorare su una vasta gamma di interessanti problemi attuali. La modellazione algoritmica, sia in teoria che in pratica, si è sviluppata rapidamente in campi al di fuori delle statistiche. Può essere utilizzato sia su set di dati complessi di grandi dimensioni sia come alternativa più accurata e informativa alla modellazione di dati su set di dati più piccoli. Se il nostro obiettivo come campo è utilizzare i dati per risolvere i problemi,

[1]: https://doi.org/10.1214/ss/1009213726 (accesso aperto)


8

Dal punto di vista dell'epidemiologia genetica, vorrei ora raccomandare la seguente serie di articoli sugli studi di associazione a livello del genoma :

  1. Cordell, HJ e Clayton, DG (2005). Studi di associazione genetica . Lancet 366, 1121-1131.
  2. Cantor, RM, Lange, K. e Sinsheimer, JS (2010). Dare la priorità ai risultati GWAS: una revisione dei metodi statistici e raccomandazioni per la loro applicazione . The American Journal of Human Genetics 86, 6–22.
  3. Ioannidis, JPA, Thomas, G., Daly, MJ (2009). Convalida, potenziamento e perfezionamento dei segnali di associazione a livello del genoma . Nature Reviews Genetics 10, 318-329.
  4. Balding, DJ (2006). Un tutorial sui metodi statistici per gli studi sulle associazioni di popolazione . Nature Reviews Genetics 7, 781-791.
  5. Green, AE et al. (2008).Utilizzo dei dati genetici nelle neuroscienze cognitive: dai dolori della crescita a intuizioni autentiche . Nature Reviews Neuroscience 9, 710-720.
  6. McCarthy, MI et al. (2008).Studi di associazione su tutto il genoma per tratti complessi: consenso, incertezza e sfide . Nature Reviews Genetics 9, 356-369.
  7. Psychiatric GWAS Consortium Coordinating Committee (2009). Studi sull'associazione genomewide: storia, logica e prospettive per i disturbi psichiatrici . American Journal of Psychiatry 166 (5), 540-556.
  8. Sebastiani, P. et al. (2009).Studi di associazione a livello del genoma e dissezione genetica di tratti complessi . American Journal of Hematology 84 (8), 504-15.
  9. The Wellcome Trust Case Control Consortium (2007). Studio di associazione su tutto il genoma di 14.000 casi di sette malattie comuni e 3.000 controlli condivisi . Natura 447, 661-678.
  10. The Wellcome Trust Case Control Consortium (2010). Studio di associazione su tutto il genoma dei CNV in 16.000 casi di otto malattie comuni e 3.000 controlli condivisi . Natura 464, 713-720.


Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.