Utilizzo di simulazioni al computer per comprendere meglio i concetti statistici a livello di laurea


11

Salve, sto seguendo un corso di laurea in Statistica e stiamo trattando le statistiche dei test e altri concetti.

Tuttavia, sono spesso in grado di applicare le formule e sviluppare una sorta di intuizione su come funzionano le cose, ma spesso mi viene la sensazione che forse se avessi sostenuto il mio studio con esperimenti simulati svilupperei una migliore intuizione sui problemi a portata di mano .

Quindi, ho pensato di scrivere semplici simulazioni per comprendere meglio alcuni dei concetti che discutiamo in classe. Ora potrei usare dire Java per:

  1. Produce una popolazione casuale con una media normale e deviazione standard.
  2. Quindi prendere un piccolo campione e provare a provare a calcolare empiricamente gli errori di tipo I e di tipo II.

Ora le domande che ho sono:

  1. È un approccio legittimo per sviluppare l'intuizione?
  2. Esiste un software per fare questo ( SAS?, R?)
  3. è una disciplina statistica che si occupa di tale programmazione: statistica sperimentale, statistica computazionale? simulazione?

1
Uso sempre la simulazione per cercare di capire meglio cosa sta succedendo. Puoi usare praticamente qualsiasi linguaggio di programmazione o programma statistico per fare questo tipo di esperimenti (anche Excel).
Giovanni,

1
+1, simulazioni e figure sono 2 delle tecniche più utili per costruire l'intuizione. Li ho usati comunemente per aiutare gli altri e me stesso a capire le cose. Ci sono molte risposte a domande CV che usano sim per illustrare cose. Se vuoi alcuni link, potrei facilmente elencare alcune delle mie risposte che hanno usato le sim in questo modo. Puoi anche fare una domanda qui sul CV in questa vena; ad es. "Sto cercando di capire _____, ma sto riscontrando difficoltà, qualcuno può fornire una spiegazione con una sim che lo chiarirà?" o "Ho fatto questa simulazione e mi suggerisce che funziona così, vero?"
gung - Ripristina Monica

4
Nel tentativo di soddisfare gli elevati standard e le aspettative di questo sito, utilizzo la simulazione (nonché derivazioni e illustrazioni teoriche) in ogni risposta che ne trarrebbe beneficio. Una grande parte delle mie recenti risposte includerà una qualche forma di simulazione, in particolare quasi tutte le risposte a una domanda con il tag r . Ad esempio, puoi guardarli attraverso la pagina di ricerca se sei interessato.
whuber

2
Troverai molti fantastici guardando le risposte di @ whuber. Dato che le mie risposte (e capacità di programmazione) tendono ad essere meno sofisticate, potrebbero fare un bel primo passo. Uso una sim per dimostrare che è difficile usare l'adattamento del modello per scegliere qui il miglior collegamento in un GLiM: differenza tra modelli logit e probit . Qui uso una sim per mostrare come la potenza cala quando le dimensioni del gruppo diventano ineguali nel test t: come si dovrebbe interpretare il confronto dei mezzi da diverse dimensioni del campione .
gung - Ripristina Monica

2
Questa domanda CV: spiegazione della simulazione statistica , può anche interessare i lettori di questa discussione.
gung - Ripristina Monica

Risposte:


7

Mi piace la tua domanda ma non ho risposte specifiche a 2 e 3? Immagino che pacchetti software come SAS (in generale prodotti SAS e non solo SAS / STAT) possano avere strumenti che facilitano la simulazione, ma non posso dirlo con certezza. Non credo che questo genere di cose si adatti a un ramo della matematica o della statistica.

Ora la domanda 1 è su cosa vorrei concentrarmi. La simulazione può aiutare ad apprendere le statistiche a tutti i livelli e può aiutare nella ricerca statistica in generale. In effetti ci sono riviste focalizzate sulla simulazione e sul calcolo. Anche la FDA sta riconoscendo l'impronta della simulazione nella progettazione di studi clinici e per aiutare a prevedere i risultati.

Negli anni '60 Julian Simon insegnava statistiche introduttive usando la simulazione come motivatore. Anche se controverso in seguito ha affermato che stava eseguendo il ricampionamento (permutazione e bootstrap) prima di Efron. Ha pubblicato un libro usando queste idee nel 1969. Di certo mancava la teoria ed era solo un sussidio didattico e non un nuovo approccio alla stima statistica. Non sviluppò nessuna delle proprietà matematiche che arrivarono con e dopo Efron.

Penso che per le statistiche introduttive sia utile fare una simulazione per dimostrare le distribuzioni campionarie, mostrare come si realizza il teorema del limite centrale e la simulazione fisica attraverso il quinconce dimostra la versione DeMoivre - Laplace del teorema del limite centrale.

A volte migliora l'intuizione. Penso che il problema di Monty Hall sia sconcertante e apparentemente paradossale anche per i matematici come Paul Erdos. Ma simulare il gioco è spesso molto convincente. Ci sono molti problemi con probabilità che sono controintuitivi e la simulazione può, credo, aiutare.

Nel 1978, quando stavo lavorando al mio dottorato di ricerca in teoria del valore estremo, avevo un'idea intuitiva di un teorema limite che stavo cercando di dimostrare. Ho lottato con la matematica. Quindi ho deciso di simulare il processo stocastico e la simulazione "ha confermato" il mio risultato. Questo mi ha dato la sicurezza di spingere per dimostrarlo.

Quindi anche a livello di laurea e oltre la simulazione può essere utile in due modi.

  1. Aiutare a sviluppare l'intuizione come suggerimento nella domanda 1 ma anche

  2. Per confermare l'intuizione come ho fatto nella mia tesi


Ho trovato qualcuno che ha affrontato il problema di Monty Hall in SAS e R qui sas-and-r.blogspot.com/2010/01/… - buon divertimento
user1172468

Susan Holmes alla Stanford University ha messo la simulazione di gioco di Monty Hall sul suo sito web diversi anni fa. Grazie per averci ricordato a @ user1172468 che molte persone possono e probabilmente stanno realizzando simulazioni su siti Web teorici.
Michael R. Chernick,

Problema di Monty Hall con R (molto facile da seguire): bodowinter.com/tutorial/bw_doodling_monty_hall.pdf
vasili111

8
  1. Sì. Dopotutto si tratta della tua intuizione.
  2. R ti farebbe bene. La codifica sarà abbastanza facile per te se conosci già Java (o qualsiasi altro "linguaggio di programmazione standard" del resto).
  3. La statistica computazionale si occupa della progettazione di algoritmi per l'implementazione di metodi statistici, probabilmente questo è il più vicino a ciò che si tenta di descrivere qui.

Divertiti con il tuo corso!


Penso che la tua risposta complimenti la mia. Ho dato una risposta dettagliata a 1 e hai fornito una risposta più definitiva a 2 e 3. Sembra che tu stia rispondendo alla domanda in pochi minuti dalla mia. Probabilmente ci siamo sovrapposti. Comunque hai dato 2 buone risposte e io ti ho dato voti positivi per loro!
Michael R. Chernick,

Grazie per il pollice in alto! Sembra che tu sia un passo avanti a me nel rispondere. :)
usεr11852,

Continua a rispondere. Mi riposerò. Ho quasi già raggiunto il mio limite di ripetizione giornaliera.
Michael R. Chernick,

Ragazzi, ho pensato che entrambe le risposte fossero buone. Ho selezionato la risposta di @Michael perché posso selezionare solo una risposta corretta e mi sono sentito affrontato alcune delle questioni più fondamentali a portata di mano.
user1172468,

1
@ user1172468 Non hai davvero bisogno di spiegare ma è bello che tu l'abbia fatto.
Michael R. Chernick,

4

Il pacchetto TeachingDemos per R è nato da un processo di pensiero simile al tuo, cercando di visualizzare e comprendere i concetti in diversi modi. Ci sono funzioni all'interno del pacchetto che usano la simulazione per aiutare a comprendere alcuni concetti chiave. La versione di sviluppo (R-forge, ma non ancora su CRAN) include una funzione "simfun" che può essere utilizzata per creare funzioni di simulazione per facilitare ulteriormente le simulazioni.



1
Elenco anche di altri collegamenti di insegnamento e apprendimento per le statistiche con R: cran.r-project.org/web/views/TeachingStatistics.html
vasili111
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.