Dare un senso alla teoria e alle applicazioni statistiche


13

Mi sono recentemente laureato con un master in modellistica medica e biologica, accompagnato da ingegneria matematica come sfondo. Anche se il mio programma educativo includeva una quantità significativa di corsi di statistica matematica (vedi sotto per un elenco), che ho gestito con voti piuttosto alti, finisco spesso per perdere completamente lo sguardo fisso sia sulla teoria che sulle applicazioni della statistica. Devo dire che, rispetto alla matematica "pura", la statistica ha davvero poco senso per me. Soprattutto le notazioni e il linguaggio usati dalla maggior parte degli statistici (compresi i miei docenti passati) è fastidiosamente contorto e quasi nessuna delle risorse che ho visto finora (tra cui Wikipedia) aveva semplici esempi a cui si potrebbe facilmente collegarsi e associarsi alla teoria fornita. ..

Questo è lo sfondo; Mi rendo anche conto dell'amara realtà che non posso avere carriera come ricercatore / ingegnere senza una solida presa di dati statistici, specialmente nel campo della bioinformatica.

Speravo di poter ottenere alcuni consigli da statistici / matematici più esperti. Come posso superare questo problema che ho menzionato sopra? Conosci qualche buona risorsa; come libri, e-book, corsi aperti (tramite iTunes o OpenCourseware per esempio) ecc.

EDIT: Come ho già detto, sono abbastanza parziale (negativamente) verso la maggior parte della letteratura sotto il titolo generale di statistica, e poiché non posso acquistare un numero di libri di testo grandi (e costosi) per ramo di statistiche, di cosa avrei bisogno in termini di un libro è qualcosa di simile a ciò che Tipler & Mosca è per la fisica, ma invece per le statistiche.

Per coloro che non conoscono Tipler; è un grande libro di testo che copre un'ampia maggioranza degli argomenti che si potrebbero incontrare durante gli studi superiori e li presenta ciascuno dall'introduzione di base a un po 'più in dettaglio. Fondamentalmente un libro di consultazione perfetto, comprato durante il mio primo anno in uni, lo uso ancora una volta ogni tanto.


I corsi che ho seguito sulle statistiche:

  • un ampio corso introduttivo,
  • processi stocastici stazionari,
  • Processi di Markov,
  • Metodi Monte Carlo
  • Analisi di sopravvivenza

Risposte:


4

Posso capire completamente la tua situazione. Anche se sono dottorando, a volte trovo difficile la teoria e l'applicazione correlate. Se sei disposto ad immergerti nella comprensione della teoria, è sicuramente gratificante quando pensi ai problemi del mondo reale. Ma il processo può essere frustrante.

Uno dei molti riferimenti che mi piacciono è Gelman e Hill's Data Analysis Using Hierarchical / Multilevel Models . Evitano la teoria in cui possono esprimere il concetto sottostante usando simulazioni. Ti trarrà sicuramente beneficio poiché hai esperienza in MCMC, ecc. Come dici, stai lavorando in bioinformatica, probabilmente anche le strategie di modellazione della regressione di Harrell sono un ottimo riferimento.

Farò di questo un wiki della comunità e lascerò che altri lo aggiungano.


Grazie per l'attenzione sulla questione. È bello vedere che non sono l'unico a confondermi per le cose. Detto questo, penso che tu abbia sopravvalutato la mia situazione; mentre ho seguito numerosi corsi e ho familiarità con l'esistenza di diversi modi di analisi statistica; non mi attaccano mai dopo i corsi. Un paio di mesi dopo gli esami, continuo a trovarmi a chiedermi; "L'ho visto / sentito da qualche parte, ma come ha funzionato davvero?" Questo per me suggerisce che ho bisogno di demolire tutto e iniziare a costruirlo con una base più forte.
posdef,

Aggiungerei un clamoroso "d'accordo" per il testo di Harrell (annotazione ortografica). È eccellente come la combinazione a due pacchetti del codice R che lo accompagna. Penso anche che "Modern Applied Statistic with S" di Venables e Ripley sarebbe una buona acquisizione. Ho avuto un background di livello master (con una laurea in fisica) prima di usare MASS per imparare R. C'è una ricchezza di saggezza nell'applicazione in quel testo.
DWin

Il libro di regressione di Gelman è meraviglioso, spiega tutto molto bene e fornisce il codice R che è davvero utile per verificare la tua comprensione del materiale.
richiemorrisroe,

2

Sei familiarità con bayesiana Analisi dei dati (da Gelman, Carlin, Stern, e Rubin)? Forse è quello di cui hai bisogno di una dose.


2

Tutti i problemi statistici si riducono essenzialmente ai seguenti 4 passaggi (che ho preso in prestito dalla risposta di @whuber su un'altra domanda ):

  1. Stimare il parametro

  2. Valutare la qualità di tale stima.

  3. Esplora i dati.

  4. Valuta la vestibilità.

È possibile scambiare i parametri di parole con il modello di parole .

I libri statistici di solito presentano i primi due punti per varie situazioni. Il problema che ogni applicazione del mondo reale richiede un approccio diverso, quindi un modello diverso, quindi gran parte dei libri finisce per catalogare questi diversi modelli. Ciò ha l'effetto indesiderato che è facile perdersi nei dettagli e perdere il quadro generale.

Il grande libro illustrato che consiglio vivamente sono le statistiche asintotiche . Dà un trattamento rigoroso dell'argomento ed è matematicamente "puro". Sebbene il suo titolo menzioni le statistiche asintotiche, il grande segreto non detto è che la maggior parte dei metodi statistici classici si basa essenzialmente su risultati asintotici.


2

Penso che la cosa più importante qui sia sviluppare un'intuizione sulla statistica e alcuni concetti statistici generali. Forse il modo migliore per farlo è avere un dominio che puoi "possedere". Questo può fornire un ciclo di feedback positivo in cui la comprensione del dominio ti aiuta a capire di più sulle statistiche sottostanti, che ti aiuta a capire di più sul dominio, ecc.

Per me quel dominio era rappresentato dalle statistiche del baseball. Ho capito che un battitore che va 3 per 4 in un gioco non è un battitore "vero" .750. Questo aiuta a capire il punto più generale che i dati di esempio non sono gli stessi della distribuzione sottostante. So anche che è probabilmente più vicino a un giocatore medio che a un battitore .750, quindi questo aiuta a capire concetti come la regressione alla media. Da lì posso arrivare all'inferenza bayesiana in piena regola dove la mia precedente distribuzione di probabilità aveva una media di quella del giocatore di baseball medio, e ora ho 4 nuovi campioni con cui aggiornare la mia distribuzione posteriore.

Non so quale sia quel dominio per te, ma immagino che sarebbe più utile di un semplice libro di testo. Gli esempi aiutano a comprendere la teoria, che aiuta a capire gli esempi. Un libro di testo con esempi è carino, ma a meno che tu non possa rendere questi esempi "tuoi", mi chiedo se ne avrai abbastanza.


1

In alternativa alle strategie di modellazione della regressione e per un approccio più pratico, i modelli statistici lineari applicati sono molto buoni dal mio punto di vista.


1

Tutti imparano in modo diverso, ma penso che sia sicuro dire che esempi, esempi, esempi, aiutano molto nelle statistiche. Il mio suggerimento sarebbe di imparare R (solo le basi sono sufficienti per aiutare molto) e quindi puoi provare qualsiasi esempio fino a sanguinare gli occhi. Puoi ordinarlo, adattarlo, tracciarlo, nominarlo. E poiché R è orientato verso le statistiche, mentre impari R, imparerai le statistiche. Quei libri che hai elencato possono quindi essere attaccati dal punto di vista "mostrami".

Poiché R è gratuito e molto materiale di origine è gratuito, tutto ciò che serve per investire è il tuo tempo.

http://www.mayin.org/ajayshah/KB/R/index.html

http://math.illinoisstate.edu/dhkim/rstuff/rtutor.html

http://www.cyclismo.org/tutorial/R/

http://www.stat.pitt.edu/stoffer/tsa2/R_time_series_quick_fix.htm

http://www.statmethods.net/about/books.html

Ci sono molti buoni libri su R che puoi comprare, eccone uno che ho usato:

http://www.amazon.com/Introductory-Statistics-R-Peter-Dalgaard/dp/0387954759

Modifica ============

Ho dimenticato di aggiungere un paio di collegamenti. Se stai usando Windows, un buon editor per alimentare R è Tinn-R (qualcun altro può aggiungere collegamenti per editor su un Mac o Linux).

http://www.sciviews.org/Tinn-R/

http://cran.r-project.org/web/packages/TinnR/


grazie per i collegamenti, cercherò di analizzarli il più possibile nelle prossime settimane ... Sono stato esposto a R una volta prima, nel corso di analisi di sopravvivenza in cui abbiamo fatto molta regressione multivariata (cox e aelen modelli) e un sacco di altre cose che non ricordo davvero. La mia impressione di R, come una persona che è molto abituata a MATLAB, è stata piuttosto negativa, ma l'ho fatto ha avuto molto a che fare con il fatto che siamo stati più o meno buttati nella parte più profonda della piscina, e quindi ci aspettavamo di imparare a nuotiamo da soli, il che ovviamente mi ha portato a odiare il software da allora in poi :) È ora di cambiarlo forse
posdef

1

Personalmente ho adorato questo, che aveva un ottimo mix di teoria e applicazione (con molti esempi). È stata una buona partita con casella e berger per un approccio più orientato alla teoria. E per un'ampia panoramica del pennello questo .


Entrambi i libri sembrano avere buone recensioni su Amazon, qualcuno può aggiungere qualche opinione (forse un po 'più in dettaglio) su questi? btw; per casella e berger intendi "Inferenza statistica"?
posdef

Sì "inferenza statistica". Per me un grande passo stava passando dalla comprensione dei modelli di probabilità a capire come usare i dati per testare i modelli e stimare i parametri dei modelli. Soprattutto il libro di Davison si concentra davvero su questo punto.
sempre al
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.