Devo prima insegnare le statistiche bayesiane o frequentiste?


32

Sto aiutando i miei ragazzi, attualmente al liceo, a capire le statistiche e sto prendendo in considerazione l'idea di iniziare con alcuni semplici esempi senza trascurare alcuni scorci di teoria.

Il mio obiettivo sarebbe quello di fornire loro l'approccio più intuitivo ma strumentalmente costruttivo per apprendere le statistiche da zero, al fine di stimolare il loro interesse nel perseguire ulteriormente le statistiche e l'apprendimento quantitativo.

Prima di iniziare, però, ho una domanda particolare con implicazioni molto generali:

Dovremmo iniziare a insegnare le statistiche usando un quadro bayesiano o frequentista?

Effettuando delle ricerche ho visto che un approccio comune sta iniziando con una breve introduzione sulle statistiche dei frequentisti seguita da una discussione approfondita delle statistiche bayesiane (ad esempio Stangl ).


5
È difficile rispondere alla tua domanda senza più contesto. Cosa vorresti ottenere?
Glen_b

4
È una cattiva genitorialità insegnare ai bambini le statistiche bayesiane, simile a versare loro vodka o accendere sigari. Nota che sia la vodka che i sigari vanno bene per gli adulti, purché li scoprano da soli
Aksakal

2
@Aksakal In realtà stavo programmando di insegnare loro il teorema di Bayes sorseggiando vodka e sbuffando havanas ... ;-)
Joe_74

2
Questo è un buon modo per tenere il bambino lontano dalle statistiche bayesiane per alcuni anni. Dite loro che sono solo le applicazioni del teorema di Bayes. Il teorema funziona bene nelle statistiche frequentiste
Aksakal

5
Il libro di Nate Silver "Il segnale e il rumore" è un caso per insegnare ai giovani le statistiche bayesiane.
Lloyd Christmas,

Risposte:


25

Sia le statistiche bayesiane che quelle frequentiste si basano sulla teoria della probabilità, ma direi che la prima si basa maggiormente sulla teoria sin dall'inizio. D'altra parte, sicuramente il concetto di intervallo credibile è più intuitivo di quello di un intervallo di confidenza, una volta che lo studente ha una buona comprensione del concetto di probabilità. Quindi, qualunque cosa tu scelga, sostengo prima di tutto il rafforzamento della loro comprensione dei concetti di probabilità, con tutti quegli esempi basati su dadi, carte, roulette, paradosso di Monty Hall, ecc.

Sceglierei un approccio o l'altro basato su un approccio puramente utilitaristico: è più probabile che studino statistiche frequentiste o bayesiane a scuola? Nel mio paese, prima o poi imparerebbero sicuramente il quadro del frequentista (e infine: mai sentito parlare di insegnamenti delle statistiche bayesiane agli studenti delle scuole superiori, l'unica possibilità è all'università o in seguito, da autodidatta). Forse nel tuo è diverso. Tieni presente che se hanno bisogno di confrontarsi con NHST (Null Hypothesis Significance Testing), ciò si presenta più naturalmente nel contesto delle statistiche frequentiste, IMO. Ovviamente è possibile verificare le ipotesi anche nel quadro bayesiano, ma ci sono molti importanti statistici bayesiani che sostengono di non utilizzare affatto il NHST, né sotto il profilo frequentista o bayesiano (ad esempio, Andrew Gelman della Columbia University).

Infine, non conosco il livello degli studenti delle scuole superiori nel tuo paese, ma nel mio sarebbe davvero difficile per uno studente assimilare con successo (le basi della) teoria della probabilità e calcolo integrale allo stesso tempo. Quindi, se decidi di seguire le statistiche bayesiane, eviterei davvero il caso variabile casuale continuo e mi attaccherei a variabili casuali discrete.


2
Avevo l'impressione (leggendo il suo blog) che Andrew Gelman avrebbe difeso contro il frequentista NSHT quanto contro Bayesian.
psarka,

2
@psarka sì, certo - non ho mai detto il contrario.
DeltaIV

3
"Nel mio paese, imparerebbero sicuramente prima il quadro dei frequentisti" - Questo (o omettendo completamente la discussione sul bayesismo) è l'approccio tradizionale in tutto il mondo.
Kodiologo,

1
@Kodiologist di cui sospettavo altrettanto. Almeno, potrebbero esserci alcuni sistemi educativi in ​​cui, dopo il quadro frequentista, anche quello bayesiano viene introdotto al liceo. Ma non è questo il caso qui.
DeltaIV

22

Bayesiano e frequentista fanno domande diverse. Bayesian chiede quali siano i valori dei parametri credibili, dati i dati osservati. Il frequentista chiede la probabilità di dati simulati immaginari se alcuni valori ipotetici dei parametri fossero veri. Le decisioni dei frequentisti sono motivate dal controllo degli errori, le decisioni bayesiane sono motivate dall'incertezza nelle descrizioni dei modelli.

Quindi quale dovresti insegnare per primo? Bene, se l'una o l'altra di quelle domande è ciò che vuoi porre prima, questa è la tua risposta. Ma in termini di accessibilità e pedagogia, penso che Bayesian sia molto più facile da capire ed è molto più intuitivo. L'idea di base dell'analisi bayesiana è la ridistribuzione della credibilità attraverso le possibilità, proprio come ha detto Sherlock Holmes, e che milioni di lettori hanno compreso intuitivamente. Ma l'idea di base dell'analisi del frequentista è molto stimolante: lo spazio di tutti i possibili set di dati che potrebbero essere accaduti se una determinata ipotesi fosse vera, e la proporzione di quei set di dati immaginari che hanno una statistica riassuntiva come o più estrema della sintesi statistica che è stata effettivamente osservata.

Un capitolo introduttivo gratuito sulle idee bayesiane è qui . Un articolo che mette fianco a fianco i concetti frequentatore e bayesiano è qui . L'articolo spiega gli approcci frequentista e bayesiano ai test di ipotesi e alla stima (e molte altre cose). La struttura dell'articolo potrebbe essere particolarmente utile per i principianti che cercano di ottenere una visione del paesaggio.


Includere i titoli del capitolo e dell'articolo potrebbe essere utile nel caso in cui i collegamenti si interrompano in futuro.
Richard Hardy,

8

Questa domanda rischia di essere basata sull'opinione, quindi cercherò di essere davvero breve con la mia opinione, quindi ti darò un suggerimento sul libro. A volte vale la pena adottare un approccio particolare perché è l'approccio adottato da un libro particolarmente valido.

Concordo sul fatto che le statistiche bayesiane siano più intuitive. La distinzione tra intervallo di confidenza e intervallo credibile lo riassume praticamente: le persone naturalmente pensano in termini di "qual è la possibilità che ..." piuttosto che l'approccio dell'intervallo di confidenza. L'approccio Intervallo di confidenza suona molto come se stesse dicendo la stessa cosa dell'intervallo credibile, tranne per il principio generale che non puoi fare l'ultimo passo dal "95% delle volte" al "95% di probabilità", che sembra molto frequentato ma tu non posso farlo. Non è incoerente, ma non intuitivo.

Equilibrando questo è il fatto che la maggior parte dei corsi universitari che seguiranno utilizzerà l'approccio frequentista meno intuitivo.

Detto questo, mi piace molto il libro Ripensare statisticamente: un corso bayesiano con esempi in R e Stan di Richard McElreath. Non è economico, quindi per favore leggilo e cercalo su Amazon prima di acquistarlo. Lo trovo un approccio particolarmente intuitivo che sfrutta l'approccio bayesiano ed è molto pratico. (E poiché R e Stan sono strumenti eccellenti per le statistiche bayesiane e sono gratuiti, è un apprendimento pratico.)

EDIT: Un paio di commenti hanno menzionato che il libro è probabilmente al di là di un liceo, anche con un tutor esperto . Quindi dovrò mettere un avvertimento ancora più grande: ha un approccio semplice all'inizio, ma si alza rapidamente. È un libro fantastico, ma davvero, dovresti davvero sfogliarlo su Amazon per avere un'idea delle sue ipotesi iniziali e della velocità con cui cresce. Belle analogie, ottimo lavoro pratico in R, flusso e organizzazione incredibili, ma forse non utili per te.

Presuppone una conoscenza di base di programmazione e R (pacchetto statistico gratuito) e una certa esposizione alle basi della probabilità e delle statistiche. Non è un accesso casuale e ogni capitolo si basa su capitoli precedenti. Inizia molto semplice, anche se la difficoltà aumenta nel mezzo - termina con una regressione multilivello. Quindi potresti voler visualizzare in anteprima parte di esso su Amazon e decidere se puoi facilmente coprire le basi o se salta un po 'troppo in fondo alla strada.

EDIT 2: La linea di fondo del mio contributo qui e il tentativo di trasformarlo dalla pura opinione è che un buon libro di testo può decidere quale approccio adottare. Preferirei un approccio bayesiano, e questo libro lo fa bene, ma forse a un ritmo troppo veloce.


2
Il libro di McElreath è eccellente, ma sarei davvero sorpreso se gli studenti delle superiori potessero seguire quel livello di trattamento, anche con un tutor di talento.
DeltaIV

2
@DeltaIV: buon feedback, modificherò la mia risposta. Sono stato ingannato più volte da quanto sia leggibile e analogico all'inizio. Entra a metà di una ripida curva di apprendimento, e probabilmente molto prima.
Wayne, il

1
Un'altra nota: penso che ci sia un divario maggiore tra i fondamenti (cioè la teoria della probabilità) e l'applicazione nei metodi frequentisti rispetto ai metodi bayesiani. Cioè, ho difficoltà a immaginare qualcuno che capisca davvero la teoria della MLE, la prova del CLT ecc., Senza un'istruzione di livello universitario, che è necessaria anche per le procedure più frequenti di Frequentist. Una volta che conosci la probabilità condizionale, capisci fondamentalmente come funziona l'inferenza bayesiana. La teoria MCMC è un po 'complicata, ma onestamente molto più semplice della comprensione della teoria MLE ...
Cliff AB

... e poiché è più facile colmare il divario tra probabilità e applicazione delle statistiche nel quadro bayesiano, almeno, penso che ciò renda le cose più soddisfacenti mentalmente più rapidamente. Odiavo seguire i corsi in cui dovevamo dire "e fidati di noi, la teoria MLE funziona con grandi campioni", poiché ritenevo che dovesse in qualche modo uccidere la curiosità scientifica di qualcuno o richiedere un impegno mentale molto più ampio.
Cliff AB,

... Ma l' intuizione dietro mle è abbastanza naturale ... stats.stackexchange.com/questions/112451/…
kjetil b halvorsen

5

Mi è stato insegnato prima l'approccio frequentista, poi quello bayesiano. Non sono uno statistico professionista.

Devo ammettere che non avevo trovato la mia precedente conoscenza dell'approccio frequentista come decisamente utile per comprendere l'approccio bayesiano.

Oserei dire che dipende da quali applicazioni concrete mostrerai in seguito ai tuoi allievi e da quanto tempo e sforzo dedicherai a loro.

Detto questo, inizierei con Bayes.


3

Il quadro bayesiano è strettamente associato alle capacità generali di pensiero critico. È quello che ti serve nelle seguenti situazioni:

  1. Pensi di candidarti per un lavoro competitivo. Quali sono le tue possibilità di entrare? Quale profitto ti aspetti di applicare?
  2. Un titolo dice che i telefoni cellulari causano il cancro negli esseri umani a lungo termine. Quante prove hanno per questo?
  3. A quale ente di beneficenza dovresti donare denaro se vuoi che abbia il massimo effetto?
  4. Qualcuno si offre di lanciare una moneta con una scommessa di $ 0,90 da te e $ 1,10 da loro. Daresti loro i soldi? Perché perché no?
  5. Hai perso le chiavi (o una bomba atomica). Da dove inizi a cercare?

Inoltre, questo è molto più interessante della memorizzazione della formula per un test t a due campioni: p. Ciò aumenta la possibilità che gli studenti rimangano interessati abbastanza a lungo da preoccuparsi di materiale sempre più tecnico.


3

Nessuno ha menzionato la probabilità, che è alla base delle statistiche bayesiane. Un argomento a favore dell'insegnamento di Bayes per primo è che il flusso dalla probabilità, alla probabilità, a Bayes, è piuttosto fluido. Bayes può essere motivato dalla probabilità osservando che (i) la funzione di probabilità assomiglia (e agisce) come una funzione di distribuzione di probabilità, ma non è perché l'area sotto la curva non è 1.0 e (ii) il grezzo, comunemente usato Wald gli intervalli assumono una funzione di verosimiglianza proporzionale a una distribuzione normale, ma i metodi bayesiani superano facilmente questa limitazione.

Un altro argomento a favore di Bayes è che la preoccupazione P (A | B) rispetto a P (B | A) sui valori di p può essere spiegata più facilmente, come menzionato da altri.

Ancora un altro argomento a favore di "Bayes first" è che costringe gli studenti a riflettere più attentamente sui modelli di probabilità condizionale, che è utile altrove, ad esempio nell'analisi di regressione.

Ci scusiamo per l'autopromozione, ma poiché è interamente in tema, non mi dispiace affermare che questo è esattamente l'approccio che Keven Henning e io abbiamo adottato nel nostro libro "Comprensione dei metodi statistici avanzati", ( https: // peterwestfall. wixsite.com/book-1 ) il cui pubblico previsto sono non statistici.


2

Stai insegnando per divertimento e comprensione o per uso pratico? Se riguarda l'insegnamento e la comprensione, andrei Bayes. Se per scopi pratici, andrei sicuramente Frequentista.

In molti campi - e suppongo che la maggior parte dei campi - delle scienze naturali, le persone sono abituate a pubblicare i loro articoli con un valore p. I tuoi "ragazzi" dovranno leggere i documenti degli altri prima di arrivare a scrivere i propri. Per leggere gli articoli di altre persone, almeno nel mio campo, devono comprendere ipotesi nulle e valori p, non importa quanto stupidi possano apparire dopo gli studi bayesiani. E anche quando saranno pronti a pubblicare il loro primo articolo, probabilmente avranno qualche scienziato senior che guida il team e, probabilmente, preferiscono il frequentismo.

Detto questo, vorrei concordare con @Wayne, in quanto il ripensamento statistico mostra un modo molto chiaro verso le statistiche bayesiane come primo approccio e non basato sulle conoscenze esistenti sul frequentismo. È fantastico come questo libro non cerchi di convincerti a combattere una statistica migliore o peggiore. L'argomento dichiarato dell'autore per Bayes è (IIRC) secondo il quale ha insegnato entrambi i tipi e Bayes è stato più facile da insegnare.


2

Vorrei stare lontano da Bayesian, seguire i giganti.

I sovietici avevano un'eccellente serie di libri per studenti delle scuole secondarie, approssimativamente tradotti in inglese come "piccola biblioteca" quantistica ". Kolmogorov ha contribuito con un libro con i coautori intitolato "Introduzione a una teoria della probabilità". Non sono sicuro che sia mai stato tradotto in inglese, ma ecco il link al suo originale russo.

Si avvicinano a spiegare le probabilità attraverso la combinatoria, che penso sia il modo migliore per iniziare. Il libro è molto accessibile per uno studente delle superiori con una matematica decente. Si noti che i sovietici hanno insegnato la matematica piuttosto ampiamente, quindi gli studenti delle scuole medie occidentali occidentali potrebbero non essere così preparati, ma con sufficiente interesse e forza di volontà possono ancora gestire il contenuto, secondo me.

Il contenuto è molto interessante per gli studenti, ha passeggiate casuali, limitazione delle distribuzioni, processi di sopravvivenza, legge di grandi numeri ecc. Se si combina questo approccio con simulazioni al computer, diventa ancora più divertente.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.