Chi sono i frequentisti?


55

Avevamo già un thread che chiedeva chi fossero i bayesiani e uno che chiedeva se i frequentatori fossero bayesiani , ma non c'era nessun thread che chiedeva direttamente chi sono i frequentatori ? Questa è una domanda che è stata posta da @whuber come commento a questa discussione e chiede una risposta. Esistono (ci sono frequentisti auto-identificati)? Forse sono stati inventati dai bayesiani che avevano bisogno di un capro espiatorio da incolpare quando criticavano le statistiche tradizionali?

Meta-commento alle risposte che sono già state fornite: al contrario, le statistiche bayesiane non sonodefinite solo in termini di utilizzo del teorema di Bayes (anche i non bayesiani lo usano), né sull'uso dell'interpretazione soggettivista della probabilità (non chiameresti un laico dicendo cose come "Scommetto che la possibilità è inferiore a 50:50!" a Bayesiano) - quindi possiamo definire il frequentismo solo in termini di interpretazione della probabilità adottata? Inoltre, le statistiche probabilità applicata , così dovrebbe definizione di frequentism essere focalizzata unicamente sulla interpretazione della probabilità?


10
Vorrei ancora sapere che cosa è un "frequentista"? Ho visto questo termine usato come un apparente riferimento a "qualsiasi non bayesiano" così come a qualcuno che sottoscrive una filosofia di probabilità frequentista. So che ci sono molti dei primi ma non sono sicuro che ci siano esponenti viventi dei secondi!
whuber

9
Contattami come frequentatore, per favore. Uniamoci! Uniti saremo forti a distruggere Bayesian al cancello una volta per tutte!
Aksakal,

10
@Aksakal ripeterlo un numero infinito di volte e lo considero significativo;)
Tim

5
Attento a chi chiami bayesiano. Per DV Lindley "Non c'è nessuno meno bayesiano di un empirico bayesiano". Molti utenti dei cosiddetti metodi bayesiani non sono realmente bayesiani. Ora con computer veloci e MCMC tutti improvvisamente sono bayesiani? Per molti, è solo un altro calcolo, come qualsiasi altro, non una filosofia radicata. La popolazione è divisa in modo disgiunto, e solo tra frequentisti e bayesiani. Che ne dici di qualcuno senza istruzione pertinente, cosa sono? Può esserci un grado (o frequenza) di bayesianness? Forse diverso in diversi giorni della settimana o tipi di analisi?
Mark L. Stone,

10
Tim, temo che questo thread possa essere influenzato dalla stessa confusione di alcuni thread correlati: vale a dire, ci sono metodi statistici frequentista vs bayesiano e ci sono interpretazioni di probabilità frequentista vs bayesiano. Queste sono due questioni diverse! Di quale stai chiedendo? La confusione è ovvia già ora, nei commenti alla risposta di @ fcop; fcop parla della definizione / interpretazione della probabilità, mentre lei ha citato OLS e si tratta di metodi statistici.
ameba dice di reintegrare Monica il

Risposte:


35

Alcune risposte esistenti parlano di inferenza statistica e alcune di interpretazione della probabilità, e nessuna fa chiaramente la distinzione. Lo scopo principale di questa risposta è fare questa distinzione.


La parola "frequentismo" (e "frequentista") può riferirsi a DUE DIVERSE COSE:

  1. Una è la domanda su quale sia la definizione o l'interpretazione della "probabilità". Esistono molteplici interpretazioni, "l'interpretazione frequente" è una di queste. I frequentisti sarebbero le persone che aderiscono a questa interpretazione.

  2. Un altro è l'inferenza statistica sui parametri del modello in base ai dati osservati. Esistono approcci bayesiani e frequentisti all'inferenza statistica, e i frequentisti sarebbero le persone che preferiscono usare l'approccio frequentista.

Ora arriva una speculazione: penso che non ci siano quasi frequentatori del primo tipo (P-frequentisti) , ma ci sono molti frequentatori del secondo tipo (S-frequentisti) .


Interpretazione frequentista della probabilità

La questione di cosa sia la probabilità è oggetto di un intenso dibattito in corso con oltre 100 anni di storia. Appartiene alla filosofia. Mi riferisco a chiunque non abbia familiarità con questo dibattito all'articolo di Interpretations of Probability nella Stanford Encyclopedia of Philosophy che contiene una sezione sull'interpretazione (i) frequentista. Un altro resoconto molto leggibile che mi è capitato di conoscere è questo documento: Appleby, 2004, Probability è un caso singolo o niente - che è scritto nel contesto delle basi della meccanica quantistica, ma contiene sezioni incentrate su quale sia la probabilità.

Appleby scrive:

Il frequentismo è la posizione secondo cui un'affermazione di probabilità equivale a un'affermazione di frequenza su un insieme scelto in modo appropriato. Ad esempio, secondo von Mises [21, 22] l'affermazione "la probabilità che questa moneta salga in testa è 0,5" è equivalente all'affermazione "in una sequenza infinita di lanci questa moneta uscirà in testa con una frequenza relativa limitante 0,5" .

Questo può sembrare ragionevole, ma ci sono così tanti problemi filosofici con questa definizione che difficilmente si sa da dove cominciare. Qual è la probabilità che pioverà domani? Domanda senza senso, perché come avremmo una sequenza infinita di prove. Qual è la probabilità che la moneta in tasca venga fuori di testa? Una frequenza relativa di teste in una sequenza infinita di colpi, dici? Ma la moneta svanirà e il Sole andrà in supernova prima che la sequenza infinita possa essere completata. Quindi dovremmo parlare di un'ipotetica sequenza infinita. Questo porta alla discussione di classi di riferimento, ecc. Ecc. In filosofia non ci si allontana così facilmente. E comunque, perché dovrebbe esistere il limite?

Inoltre, se la mia moneta dovesse arrivare a testa il 50% delle volte durante il primo miliardo di anni, ma poi inizierebbe a salire a testa solo il 25% delle volte (esperimento pensato da Appleby)? Ciò significa che per definizione. Ma osserveremo sempre nei prossimi miliardi di anni. Pensi che una situazione del genere non sia davvero possibile? Certo, ma perché? Perché la non può cambiare improvvisamente? Ma questa frase non ha senso per un P-frequentista.F r e q u E n c y ( H all'e un d s ) 1 / 2 P ( H all'e un d s )P(Heads)=1/4Frequency(Heads)1/2P(Heads)

Voglio mantenere breve questa risposta, quindi mi fermo qui; vedi sopra per i riferimenti. Penso che sia davvero difficile essere un frequentatore P duro.

(Aggiornamento: nei commenti seguenti, @mpiktas insiste sul fatto che la definizione di frequentista è matematicamente insignificante. La mia opinione espressa sopra è piuttosto che la definizione di frequentista è filosoficamente problematica.)


Approccio frequentista alla statistica

Si consideri un modello probabilistico che ha alcuni parametri e permette di calcolare la probabilità di osservare i dati . Hai fatto un esperimento e ha osservato alcuni dati . Cosa puoi dire di ?θ X X θP(Xθ)θXXθ

S-frequentism è la posizione che non è una variabile casuale; i suoi veri valori nel mondo reale sono quelli che sono. Possiamo provare a stimarli come alcuni , ma non possiamo parlare in modo significativo della probabilità che sia in un certo intervallo (ad esempio, essere positivo). L'unica cosa che possiamo fare è escogitare una procedura per costruire un intervallo attorno alla nostra stima in modo tale che questa procedura riesca a comprendere true con una particolare frequenza di successo a lungo termine (particolare probabilità).θ θ θθθ^θθ

La maggior parte delle statistiche utilizzate nelle scienze naturali oggi si basa su questo approccio, quindi oggi ci sono molti S-frequentisti in giro.

(Aggiornamento: se cerchi un esempio di filosofo della statistica, al contrario dei praticanti della statistica, che difende il punto di vista del S-frequentista, leggi gli scritti di Deborah Mayo; +1 alla risposta di @ NRH.)


AGGIORNAMENTO: Sul rapporto tra P-frequentismo e S-frequentismo

@fcop e altri chiedono informazioni sulla relazione tra P-frequentismo e S-frequentismo. Una di queste posizioni implica un'altra? Non c'è dubbio che storicamente il S-frequentismo è stato sviluppato sulla base della posizione del P-frequentista; ma si implicano logicamente l'un l'altro?

Prima di affrontare questa domanda dovrei dire quanto segue. Quando ho scritto sopra che non ci sono quasi P-frequentisti, non intendevo dire che quasi tutti sono P-soggettivi-bayesiani-a-la-de-finetti o P-propensitisti-a-la-popper. In realtà, credo che la maggior parte degli statistici (o data scientist o machine learning) siano P-niente-per-niente o P-zitto-e-calcola (per prendere in prestito la famosa frase di Mermin ). La maggior parte delle persone tende a ignorare i problemi di base. E va bene Non abbiamo una buona definizione di libero arbitrio, intelligenza, tempo o amore. Ma ciò non dovrebbe impedirci di lavorare sulle neuroscienze, sull'IA, sulla fisica o sull'innamoramento.

Personalmente, non sono un S-frequentista, ma non ho nemmeno una visione coerente sulle basi della probabilità.

Al contrario, quasi tutti coloro che hanno fatto qualche analisi statistica pratica sono o un S-frequentista o un S-bayesiano (o forse una miscela). Personalmente, ho pubblicato articoli contenenti -values ​​e non ho mai (finora) pubblicato articoli contenenti priori e posteriori sui parametri del modello, quindi questo mi rende un S-frequentista, almeno in pratica.p

È quindi chiaramente possibile essere un S-frequentista senza essere un P-frequentista, nonostante ciò che dice @fcop nella sua risposta.

Va bene. Belle. Ma ancora: un P-bayesiano può essere un S-frequentista? E un frequentatore P può essere un bayesiano S?

Per un convinto P-bayesiano è probabilmente atipico essere un S-frequentista, ma in linea di principio è del tutto possibile. Ad esempio un bayesiano P può decidere di non avere alcuna informazione precedente su e quindi adottare un'analisi S-frequentist. Perchè no. Ogni affermazione del S-frequentista può certamente essere interpretata con l'interpretazione della probabilità P bayesiana.θ

Per un frequentatore P convinto di essere bayesiano S è probabilmente problematico. Ma poi è molto problematico essere un frequentatore P convinto ...


2
I commenti non sono per una discussione estesa; questa conversazione è stata spostata in chat .
Glen_b,

13

Il lavoro di Kolmogorov su Foundations of Theory of Probability ha la sezione intitolata "Relazione con i dati sperimentali" a pag.3. Questo è ciò che ha scritto lì:

inserisci qui la descrizione dell'immagine

inserisci qui la descrizione dell'immagine

Sta mostrando come si possano dedurre i suoi assiomi osservando esperimenti. Questo è un modo abbastanza frequente di interpretare le probabilità.

Ha un'altra citazione interessante per eventi impossibili (set vuoti):

inserisci qui la descrizione dell'immagine

Quindi, penso che se ti senti a tuo agio con questi argomenti, allora devi ammettere che sei un frequentatore. Questa etichetta non è esclusiva. Puoi essere bi-paradigma (ho inventato la parola), cioè sia un frequentatore che un bayesiano. Ad esempio, divento bayesiano quando applico metodi stocastici a fenomeni che non sono intrinsecamente stocastici.

AGGIORNAMENTO Come ho scritto prima su CV, la stessa teoria di Kolmogorov non è di per sé frequentista. È compatibile con la vista bayesiana come con la vista frequentista. Ha messo questa simpatica nota a piè di pagina nella sezione per chiarire che si astiene dalla filosofia:

inserisci qui la descrizione dell'immagine


1
bene la maggior parte dei sistemi assiomatici sono derivati ​​da "astrarre" o "generalizzare" i concetti del mondo reale. Lo stesso vale per il concetto (assiomi) di una "metrica", hanno osservato il concetto del mondo reale (distanza eucildea) e "trovato" tre proprietà che hanno usato come "assiomi" in uno spazio metrico. Ma la tua risposta è buona (+1), mostra che Kolmogorov non ha '' inventato '' i suoi assiomi '' dal nulla '', ha sviluppato un sistema assiomatico che era legato alla comprensione di quale fosse la proponibilità in quel momento .

1
Potresti guardare i commenti di @mpiktas a questa domanda e dire che lo stesso Kolmogorov ha dato quella definizione? vedi commenti su stats.stackexchange.com/questions/230415/…

2
@fcop, ricordo la sua risposta. Sembrava ragionevole. Puoi sicuramente derivare gli assiomi di Bayes, e Kolmogorov lo dimostra nel libro.
Aksakal,

1
+1 Esattamente quello che avevo in mente (la nota a piè di pagina, in particolare) quando stavo scrivendo commenti su thread correlati. Anche l'ultimo commento di @Aksakal.
Graeme Walsh,

1
@Aksakal: riferendosi al tuo commento sopra: non era la "sua" risposta ma la mia :-)

8

Credo che sia rilevante menzionare Deborah Mayo, che scrive il blog Error Statistics Philosophy .

Non pretenderò di avere una profonda comprensione della sua posizione filosofica, ma il quadro delle statistiche degli errori , come descritto in un articolo con Aris Spanos, include quelli che sono considerati metodi statistici frequentisti classici. Per citare il documento:

Sotto l'egida dei metodi statistici degli errori, si possono includere tutti i metodi standard che utilizzano le probabilità di errore basate sulle frequenze relative degli errori nel campionamento ripetuto, spesso chiamato teoria del campionamento o statistica del frequentista .

E più in basso nello stesso documento puoi leggere che:

Per l'errore, la statistica si pone non per misurare i gradi di conferma o convinzione (reali o razionali) nelle ipotesi, ma per quantificare con quale frequenza i metodi sono in grado di discriminare tra ipotesi alternative e con quale facilità facilitano il rilevamento dell'errore.


2
+1, ben fatto menzionando il blog di Mayo. È davvero la filosofa più vocale della statistica che sostiene le statistiche dei frequentisti. La maggior parte degli altri rant su Internet in questi giorni sono a favore delle statistiche bayesiane.
ameba dice Reinstate Monica il

6

nnAAAP(A)

P(A):=limn+nAn

Non è difficile vedere che questa definizione soddisfa gli assiomi di Kolmogorov (poiché prendere limiti è lineare, vedi anche Esistono basi * matematiche * per il dibattito bayesiano vs frequentista? ).

Per dare una tale definizione devono '' credere '' che questo limite esista. Quindi i frequentisti sono quelli che credono nell'esistenza di questo limite.

MODIFICA il 31/8/2016: sulla distinzione tra frequentismo S e P.

Mentre @amoeba distingue nella sua risposta tra S-frequentisti e P-frequentisti, dove i P-frequentisti sono il tipo di frequentatori che io definisco supra, e poiché sostiene anche che è difficile essere un P-frequentista, ho aggiunto una sezione EDIT sostenere che è vero il contrario;

Sostengo che tutti i S-frequentisti siano P-frequentisti .

Nella sezione S-frequentism @amoeba afferma che "questa procedura riesce a comprendere true con una particolare frequenza di successo a lungo termine (particolare probabilità)."θ

Nella sua risposta afferma anche che i P-frequentisti sono una specie rara.

Ma questa "frequenza di successo a lungo termine", usata per definire il S-frequentismo, è ciò che definisce P-frequentismo in quanto è l'interpretazione di .P(CI^θ)

Pertanto, secondo le sue definizioni, ogni S-frequentista è anche un P-frequentista. Pertanto, concludo che i frequentatori di P non sono così rari come sostenuto dall'ameba.

C'è ancora di più; @amoeba sostiene inoltre che gli S-frequentisti considerano il parametro sconosciuto come fisso o non casuale, quindi non si può parlare di '' probabilità che abbia un valore particolare '', dice cheθθθ

'' L'unica cosa che possiamo fare è escogitare una procedura per costruire un intervallo attorno alla nostra stima in modo tale che questa procedura riesca a comprendere true con una particolare frequenza di successo a lungo termine (particolare probabilità). ''θ

Posso chiedere quale potrebbe essere l'origine del nome '' frequentista '': (a) l' idea '' non casuale '' o (b) l'idea di '' frequenza a lungo termine ''?θ

Posso anche chiedere a @mpiktas che scrive nel suo commento la risposta di ameba:

"È molto difficile essere un P-frequentista, perché è praticamente impossibile dare una definizione matematicamente sana di tale probabilità"

Se hai bisogno di una definizione del P-frequentismo per definire il S-frequentismo, come puoi essere più S-frequentista che P-frequentista?


3
@Tim: perché OLS dovrebbe essere "frequentista"?

2
Se è così, allora l'intera discussione su chi sono i frequentatori non sembra avere molto senso poiché il loro campo di interesse è molto limitato e enormi aree di statistica sono fuori dal loro campo di applicazione ... (Comprese molte aree che sono di interesse di Bayesiani.) Quello che sto dicendo è che questa non sembra essere la definizione poiché è troppo stretta.
Tim

2
Cosa credono i bayesiani (autoproclamati o semplicemente pragmatici che indossano il loro "cappello bayesiano" per l'interludio) ? limn+nAn
Silverfish

1
@Silverfish bayesiani sono liberi di usare le frequenze a lungo termine come probabilità se lo desiderano, solo i frequentatori non hanno alcuna opzione. La differenza chiave è che un bayesiano potrebbe dire che , ma in conclusione siamo interessati a definire una distribuzione sui valori plausibili di che otteniamo dalle osservazioni 1E12. p Hl i m n + n A / n p Hlimn+nA/npHlimn+nA/npH
Dikran Marsupial,

3
fondamento della teoria della probabilità proprio per quel motivo, cioè per dare certe interpretazioni del suono con probabilità un background matematico. Ora vuoi tornare indietro e "reinventare" la probabilità con la tua definizione "frequentista". Lo trovo fuorviante, quindi declasserò le tue risposte. Sei il benvenuto a ignorarlo, questo è il modo in cui funziona il sito, c'è sempre possibilità di disaccordo.
mpiktas,

4

Domanda davvero interessante!

Mi metterei nel campo frequentista quando si tratta di comprendere e interpretare le dichiarazioni di probabilità, anche se non sono così duro sulla necessità di una sequenza effettiva di esperimenti iid per fondare questa probabilità. Sospetto che la maggior parte delle persone che non acquistano la tesi secondo cui "la probabilità è una misura soggettiva della credenza" penserebbe anche alla probabilità in questo modo.

Ecco cosa intendo: prendi la nostra solita moneta "giusta", con incarico . Quando sento questo, faccio l'immagine di qualcuno che lancia questa moneta molte volte e la frazione di teste si avvicina a . Ora, se premuto, direi anche che la frazione di teste in qualsiasi campione casuale da una sequenza finita di tali lanci di monete si avvicinerà anche a man mano che la dimensione del campione aumenta (ipotesi di indipendenza).0,5 0,5P(H)=0.50.50.5

Come è stato affermato da altri, il presupposto più grande è che questo limite esiste ed è corretto (cioè, il limite è ), ma penso che sia altrettanto importante il presupposto che lo stesso limite esiste anche per sottocampioni scelti casualmente. Altrimenti, la nostra interpretazione ha significato solo per l'intera sequenza infinita (ad esempio, potremmo avere una forte autocorrelazione che viene mediata).0.5

Penso che quanto sopra sia piuttosto controverso per i frequentatori. Un bayesiano sarebbe più concentrato sull'esperimento in corso e meno sul comportamento a lungo termine: affermerebbero che il loro grado di convinzione che il prossimo lancio sarà di testa è ... punto.P(H)=0.5

Per un caso semplice come il lancio delle monete, possiamo vedere che gli approcci frequentista e bayesiano sono funzionalmente equivalenti, sebbene filosoficamente molto diversi. Come ha sottolineato Dikran Marsupial, il bayesiano potrebbe in effetti utilizzare il fatto che empiricamente vediamo monete che escono di testa tutte le volte che le vediamo spuntare di coda (lunga frequenza / grande frequenza di campionamento come in precedenza).

Che dire di cose che non possono possibilmente avere frequenze a lungo termine? Ad esempio, qual è la probabilità che la Corea del Nord inizi una guerra con il Giappone nei prossimi 10 anni? Per i frequentatori, siamo davvero rimasti in difficoltà, dal momento che non possiamo davvero descrivere le distribuzioni di campionamento necessarie per verificare tale ipotesi. Un bayesiano sarebbe in grado di affrontare questo problema posizionando la distribuzione di probabilità sulle possibilità, molto probabilmente sulla base del contributo di esperti.

Tuttavia, sorge una domanda chiave: da dove provengono questi gradi di credenza (o valore assunto per la frequenza di lungo periodo)? Discuterei dalla psicologia e direi che queste credenze (specialmente in aree lontane dai dati sperimentali) provengono da quella che viene definita euristica della disponibilità e euristica della rappresentatività . Ci sono molti altri che probabilmente entrano in gioco. Lo sostengo perché in assenza di dati per calibrare le nostre convinzioni (verso la frequenza osservata a lungo termine!), Dobbiamo fare affidamento sull'euristica, per quanto sofisticata la facciamo sembrare.

Il suddetto pensiero euristico mentale si applica ugualmente a Frequentisti e Bayesiani. Ciò che è interessante per me è che indipendentemente dalla nostra filosofia, alla radice, poniamo più fiducia in qualcosa che pensiamo sia più probabile che sia vero e crediamo che sia più probabile che sia vero perché crediamo che ci siano più modi perché sia ​​vero, o immaginiamo che i percorsi che lo rendono vero accaderebbero più spesso (frequentemente :-) di quelli che lo renderebbero non vero.

Dato che è un anno elettorale, facciamo un esempio politico: quale convinzione vorremmo mettere nella dichiarazione "Ted Cruz proporrà un divieto di fucili d'assalto nei prossimi 4 anni". Ora, abbiamo alcuni dati su questo dalle sue stesse dichiarazioni, e probabilmente metteremmo la nostra precedente credenza nella verità di questa affermazione molto vicino allo zero. Ma perché? Perché le sue precedenti dichiarazioni ci fanno pensare in questo modo? Perché pensiamo che le persone altamente ideologiche tendano a "attenersi alle loro armi" più delle loro controparti pragmatiche. Da dove viene? Probabilmente dagli studi condotti dagli psicologi e dalle nostre esperienze con persone di alto livello.

In altre parole, abbiamo alcuni dati e la convinzione che per la maggior parte dei casi in cui qualcuno come Cruz potrebbe cambiare idea, non lo faranno (di nuovo, una valutazione a lungo termine o di ampio campione di sorta).

Questo è il motivo per cui "cauco" con i frequentatori. Non è la mia antipatia per la filosofia bayesiana (abbastanza ragionevole) o i metodi (sono fantastici!), Ma che se scavo abbastanza in profondità nel motivo per cui ho convinzioni che mancano di un forte supporto di grandi campioni, trovo che mi affido a una sorta del modello mentale in cui i risultati possono essere raggiunti (se implicitamente) o in cui posso invocare le probabilità a lungo termine in un particolare sottoprocesso (ad esempio, i repubblicani votano contro le misure di controllo delle armi il X% delle volte) per ponderare la mia convinzione in un modo o nell'altro .

Naturalmente, questo non è il vero frequentismo, e dubito che ci siano molte persone che sottoscrivono l'interpretazione della probabilità di von Mieses alla lettera. Tuttavia, penso che mostri la sottostante compatibilità tra probabilità bayesiana e frequentista: entrambi fanno appello alla nostra euristica interiore per quanto riguarda la disponibilità o quello che chiamo il principio "Pachinko" sulle frequenze lungo una catena di causalità.

Quindi forse dovrei definirmi un "disponibista", per indicare che assegno le probabilità in base alla frequenza con cui posso immaginare un evento accadere come il risultato di una catena di eventi (con un certo rigore / modellizzazione ovviamente). Se ho molti dati, fantastico. In caso contrario, cercherò di scomporre l'ipotesi in una catena di eventi e di utilizzare i dati che ho (aneddoti o "buon senso", secondo necessità) per valutare con quale frequenza immagino si verifichi un evento del genere.

Ci scusiamo per il post lungo, ottima domanda BTW!


1
Fai enormi semplificazioni eccessive sull'approccio soggettivistico alla probabilità. Sono d'accordo sul fatto che la psicologia abbia un ruolo nel modo in cui lavori con i dati, ma puoi anche effettuare analisi soggettivamente distorte nell'approccio frequentista. Alcuni bayesiani sostengono che nel caso bayesiano rendi esplicite le tue convinzioni soggettive, piuttosto che ignorarle.
Tim

1
@Tim Non stavo dicendo che i frequentisti sono più obiettivi (vedi la mia prima parte sui principali presupposti per i frequentisti). Inoltre, ciò che stavo sottolineando è che sia i frequentisti che i bayesiani fondano le loro probabilità nelle loro convinzioni su quanto spesso accadrebbe qualcosa o quante cose devono accadere (e la loro probabilità individuale di farlo) per rendere qualcosa di vero.

1
@Tim dato che questo non è un post sul bayesianismo contro il frequentismo in sé, dubito di aver dato loro il dovuto ... che richiederebbe molto spazio nella pagina! Fondamentalmente, tutti pensiamo all'euristica mentale quando pensiamo alla probabilità, e queste euristiche ci portano a pensare che alcuni tipi di eventi possano accadere "in più modi" o essere "più accessibili in una rete causale" rispetto ad altri.

1
@Tim OK ... Ho aggiunto alcune lingue per chiarire quando passo dalla mia (breve) discussione sul bayesismo al mio spiel principale.

4

Come notato da @amoeba , abbiamo una definizione frequente di probabilità e statistiche frequenti . Tutte le fonti che ho visto fino ad ora affermano che l'inferenza del frequentista si basa sulla definizione di probabilità del frequentatore, cioè capendolo come limite in proporzione dato il numero infinito di estrazioni casuali (come già notato da @fcop e @Aksakal citando Kolmogorov)

P(A)=limnnAn

Quindi, fondamentalmente, esiste una nozione di popolazione da cui possiamo ripetere ripetutamente. La stessa idea è usata nell'inferenza frequentista. Ho esaminato alcuni documenti classici, ad esempio di Jerzy Neyman , per tracciare le basi teoriche delle statistiche dei frequentisti. Nel 1937 Neyman scrisse

( Ia ) L'esperto di statistica si occupa di una popolazione, , che per qualche motivo o l'altro non può essere studiato in modo esaustivo. Da questa popolazione è possibile solo prelevare un campione che può essere studiato in dettaglio e utilizzato per formare un'opinione sui valori di alcune costanti che descrivono le proprietà della popolazione . Ad esempio, si può desiderare di calcolare approssimativamente la media di un certo carattere posseduto dagli individui che formano la popolazione , ecc. ( Ibπ π ππππ
) In alternativa, lo statistico può occuparsi di determinati esperimenti che, se ripetuti in condizioni apparentemente identiche, producono risultati variabili. Tali esperimenti sono chiamati esperimenti casuali [...]
In entrambi i casi descritti, il problema con cui lo statistico deve affrontare è il problema della stima. Questo problema consiste nel determinare quali operazioni aritmetiche dovrebbero essere eseguite sui dati osservativi al fine di ottenere un risultato, da chiamare una stima, che presumibilmente non differisce molto dal vero valore del carattere numerico, né della popolazione , come in ( ia ), o degli esperimenti casuali, come in ( ib ). [...] In ( iaπ
) parliamo di uno statistico che preleva un campione dalla popolazione studiata.

In un altro articolo (Neyman, 1977), nota che le prove fornite nei dati devono essere verificate osservando la natura ripetuta del fenomeno studiato:

Di solito, la "verifica" o "convalida" di un modello indovinato consiste nel dedurre alcune delle sue conseguenze frequenti in situazioni non precedentemente studiate empiricamente, e quindi nell'eseguire esperimenti appropriati per vedere se i loro risultati sono coerenti con le previsioni. In generale, il primo tentativo di verifica è negativo: le frequenze osservate dei vari risultati dell'esperimento non sono d'accordo con il modello. Tuttavia, in alcune occasioni fortunate c'è un accordo ragionevole e si sente la soddisfazione di aver "capito" il fenomeno, almeno in qualche modo generale. Più tardi, invariabilmente, compaiono nuove scoperte empiriche, che indicano l'inadeguatezza del modello originale e ne richiedono l'abbandono o la modifica. E questa è la storia della scienza!

e in un altro articolo Neyman e Pearson (1933) scrivono di campioni casuali prelevati da popolazione fissa

Nella pratica statistica comune, quando i fatti osservati sono descritti come "campioni" e le ipotesi riguardano le "popolazioni", per le quali sono stati disegnati i campioni, i caratteri dei campioni, o come li chiameremo criteri, che sono stati usato per verificare le ipotesi, sembra spesso essere risolto da una felice intuizione.

Le statistiche dei frequentisti in questo contesto formalizzano il ragionamento scientifico in cui vengono raccolte le prove, quindi vengono estratti nuovi campioni per verificare i risultati iniziali e man mano che accumuliamo più prove il nostro stato di conoscenza cristallizza. Ancora una volta, come descritto da Neyman (1977), il processo prende le seguenti fasi

( i ) Stabilimento empirico di frequenze relative a lungo termine apparentemente stabili (o "frequenze" in breve) di eventi giudicati interessanti, man mano che si sviluppano in natura.
( ii ) Indovinare e quindi verificare il "meccanismo casuale", il cui funzionamento ripetuto produce le frequenze osservate. Questo è un problema di "teoria della probabilità frequentista". Occasionalmente, questo passaggio è etichettato come "modellismo". Naturalmente, il meccanismo del caso indovinato è ipotetico.
( iii ) Usare l'ipotetico meccanismo casuale del fenomeno studiato per dedurre le regole di adattamento delle nostre azioni (o "decisioni") alle osservazioni in modo da garantire la massima "misura" di "successo". [... delle "regole di adattamento delle nostre azioni" è un problema di matematica, in particolare di statistica matematica.

I frequentisti pianificano le loro ricerche tenendo conto della natura casuale dei dati e dell'idea di estrazioni ripetute da popolazione fissa, progettano i loro metodi basati su di essi e li usano per verificare i loro risultati (Neyman e Pearson, 1933),

Senza sperare di sapere se ogni singola ipotesi sia vera o falsa, potremmo cercare delle regole per governare il nostro comportamento nei loro confronti, in seguito alle quali assicuriamo che, nel lungo periodo dell'esperienza, non sbaglieremo troppo spesso.

Questo è collegato al principio di campionamento ripetuto (Cox e Hinkley, 1974):

(ii) Forte principio di campionamento ripetuto
Secondo il forte principio di campionamento ripetuto, le procedure statistiche devono essere valutate in base al loro comportamento in ipotetiche ripetizioni nelle stesse condizioni. Questo ha due aspetti. Le misure di incertezza devono essere interpretate come frequenze ipotetiche nelle ripetizioni a lungo termine; i criteri di ottimalità devono essere formulati in termini di comportamento sensibile in ipotetiche ripetizioni.
L'argomento per questo è che assicura un significato fisico per le quantità che calcoliamo e che assicura una stretta relazione tra l'analisi che facciamo e il modello sottostante che viene considerato come rappresentante il "vero" stato delle cose.

(iii) Principio di campionamento ripetuto
debole La versione debole del principio di campionamento ripetuto richiede che non dovremmo seguire procedure che per alcuni possibili valori di parametro darebbero, in ipotetiche ripetizioni, conclusioni fuorvianti per la maggior parte del tempo.

Al contrario, quando si utilizza la massima probabilità ci occupiamo del campione che abbiamo e nel caso bayesiano facciamo deduzione in base al campione e ai nostri priori e quando appaiono nuovi dati possiamo eseguire l'aggiornamento bayesiano. In entrambi i casi l'idea del campionamento ripetuto non è cruciale. I frequentatori fanno affidamento solo sui dati in loro possesso (come notato da @WBT ), ma tenendo presente che si tratta di qualcosa di casuale e deve essere considerato come parte del processo di campionamento ripetuto da parte della popolazione (ricordare, ad esempio, come la fiducia gli intervalli sono definiti).

Nel caso del frequentista l'idea di campionamenti ripetuti ci consente di quantificare l' incertezza (nelle statistiche) e ci consente di interpretare gli eventi della vita reale in termini di probabilità .


Come nota a margine, notate che né Neyman (Lehmann, 1988), né Pearson (Mayo, 1992) erano puri frequentatori come potevamo immaginare. Ad esempio, Neyman (1977) propone di utilizzare Empirical Bayesian e Maximum Likelihood per la stima puntuale. D'altra parte (Mayo, 1992),

nella risposta di Pearson (1955) a Fisher (e altrove nel suo lavoro) è che per contesti scientifici Pearson respinge sia la logica della probabilità di errore a lungo termine [...]

Quindi sembra che sia difficile trovare pure frequentisti anche tra i padri fondatori.


Neyman, J e Pearson, ES (1933). Sul problema delle prove più efficienti di ipotesi statistiche. Transazioni filosofiche della Royal Society A: Scienze matematiche fisiche e ingegneristiche. 231 (694–706): 289–337.

Neyman, J. (1937). Cenni di una teoria della stima statistica basata sulla teoria classica della probabilità. Phil. Trans. R. Soc. Lond. A. 236: 333–380.

Neyman, J. (1977). Probabilità del frequentista e statistiche del frequentista. Synthese, 36 (1), 97-131.

Mayo, DG (1992). Pearson ha respinto la filosofia statistica di Neyman-Pearson? Synthese, 90 (2), 233-262.

Cox, DR e Hinkley, DV (1974). Statistiche teoriche. Chapman and Hall.

Lehmann, E. (1988). Jerzy Neyman, 1894 - 1981. Rapporto tecnico n. 155. Dipartimento di Statistica, Università della Califomia.


1
+1 (già alcuni giorni fa). Grazie per averlo scritto, ci sono alcune buone citazioni qui e l'elenco dei riferimenti è molto utile. A mia volta, ho aggiornato la mia risposta in diversi punti, ma soprattutto alla fine, per chiarire la relazione tra il frequentismo di P e S come la vedo io. Sono certamente d'accordo sul fatto che storicamente S-freq fosse costruito su idee P-freq, come lei sostiene qui, ma non penso che si implicino necessariamente a vicenda.
ameba dice Reinstate Monica il

4

Consentitemi di offrire una risposta che colleghi questa domanda a una questione di importanza attuale e molto pratica : la Medicina di Precisione, rispondendo allo stesso tempo letteralmente come è stato chiesto: chi sono i frequentisti?

I frequentisti sono persone che dicono cose come [1] (sottolineatura mia):

Cosa significa un rischio del 10% di un evento nel prossimo decennio per l'individuo per il quale è stato generato? Contrariamente a quanto si pensa, questo livello di rischio non è il rischio personale di quella persona perché la probabilità non è significativa in un contesto individuale .

Pertanto, i frequentisti interpretano la "probabilità" in modo tale che non abbia alcun significato in un contesto singolare come quello di un singolo paziente . Il mio commento su PubMed Commons su [1] esamina le contorsioni che i suoi autori frequentisti devono subire per recuperare una parvenza di una nozione di probabilità applicabile alla cura di un singolo paziente. Osservare come e perché lo fanno può rivelarsi molto istruttivo su chi è un frequentatore . Inoltre, lo scambio successivo in gran parte poco illuminante nella sezione Lettere di JAMA [2,3] è istruttivo sull'importanza di riconoscere esplicitamente le limitazioni nelle nozioni frequentiste di probabilità e di attaccarle direttamentecome tale. (Mi dispiace che molti utenti di CV possano scoprire che [1] si trova dietro un paywall.)

L'eccellente e leggibile libro [4] di L. Jonathan Cohen ripagherà gli sforzi di chiunque sia interessato alla domanda del PO. Da notare che il libro di Cohen è stato citato stranamente da [1] in relazione all'affermazione "la probabilità non è significativa in un contesto individuale", sebbene Cohen rimproveri chiaramente questa visione come segue [4, p49]:

Né è aperto a un teorico della frequenza affermare che tutte le probabilità importanti sono effettivamente generali, non singolari. Spesso sembra molto importante poter calcolare la probabilità di successo dell'appendicectomia di tuo figlio ...


1] Sniderman AD, D'Agostino Sr RB e Pencina MJ. "Il ruolo dei medici nell'era dell'analisi predittiva". JAMA 314, n. 1 (7 luglio 2015): 25-26. doi: 10.1001 / jama.2015.6177. PubMed

2] Van Calster B, Steyerberg EW e Harrell FH. "Previsione RIsk per gli individui". JAMA 314, n. 17 (3 novembre 2015): 1875-1875. doi: 10.1001 / jama.2015.12215. Testo intero

3] Sniderman AD, D'Agostino Sr RB e Pencina MJ. "Previsione RIsk per gli individui: risposta." JAMA 314, n. 17 (3 novembre 2015): 1875-1876. doi: 10.1001 / jama.2015.12221. Testo intero

4] Cohen, L. Jonathan. Un'introduzione alla filosofia dell'induzione e della probabilità. Oxford: New York: Clarendon Press; Oxford University Press, 1989. Link alle pagine scansionate 46-53 e 81-83



Mi piace la citazione "il rischio può essere considerato come il livello soggettivo al quale si" crede "o si è" preparati a scommettere "sul verificarsi di una malattia o di un evento, 2 proprio come si scommette su futuri eventi di una volta nei giochi di sport ". Grazie per il tuo contributo e riferimenti.
Tim

2
Sembra una buona risposta, ma sono un po 'confuso. Credo che i frequentatori si occupino di procedure (esperimenti) che, in teoria, potrebbero essere eseguite un numero infinito di volte. Ciò non significa che non possano fare previsioni sul prossimo lancio della moneta, solo che le loro preoccupazioni / assicurazioni si concentrano sul processo. È vero, direbbero che "gli Stati Uniti vinceranno i Mondiali quest'anno" non è qualcosa di cui non possano dire nulla, ma non potrebbero dire qualcosa sull'appendicectomia di tuo figlio - è unica in un certo senso, ma appendici su i bambini no.
Wayne,

@Tim, grazie per il link, che include sia [2] che [3]. Ho aggiornato di conseguenza il testo della mia risposta.
David C. Norris,

2
@Wayne, suggerirei che la risposta di ameba sopra - con la sua distinzione tra procedure statistiche abitualmente associate alla "visualizzazione della frequenza della probabilità" e quella stessa visualizzazione della frequenza - risponde al tuo commento. Le persone potrebbero usare procedure statistiche frequentiste, e tuttavia interpretare e utilizzare le probabilità risultanti in modo fiduciario o soggettivista. Basta vedere l'errore perpetuo dell'interpretazione dei valori di P come "la probabilità che l'ipotesi nulla sia vera" per vedere che è così.
David C. Norris,

3

"Frequentists vs. Bayesians" di XKCD (sotto CC-BY-NC 2.5 ), clicca per discutere:

'Rivelatore!  Che cosa direbbe lo statistico bayesiano se gli chiedessi se il ... '' [roll] 'I AM A NEUTRINO DETECTOR, NOT A LABYRINTH GUARD.  SERIAMENTE, IL TUO CERVELLO È CADUTO? '  [rotolo] '... sì.'

Il punto generale della filosofia frequentista illustrata qui è la convinzione di trarre conclusioni sulla probabilità relativa degli eventi basata esclusivamente ("puramente") sui dati osservati, senza "inquinare" quel processo di stima con nozioni preconcette su come le cose dovrebbero o non dovrebbero essere. Nel presentare una stima della probabilità, il frequentista non tiene conto delle credenze precedenti sulla probabilità di un evento quando sono disponibili osservazioni per supportare il calcolo della sua probabilità empirica. Il frequentatore dovrebbe tenere conto di queste informazioni di base al momento di decidere la soglia di azione o conclusione.

Come ha scritto Dikran Marsupial in un breve commento di seguito , "Il punto prezioso che il fumetto (forse involontariamente) sottolinea è che la scienza è davvero più complessa e non possiamo semplicemente applicare il" rituale nullo "senza pensare alla conoscenza precedente."

Come altro esempio, quando si cerca di determinare / dichiarare quali argomenti sono "di tendenza" su Facebook, i frequentatori probabilmente apprezzerebbero l'approccio di conteggio più puramente algoritmico verso cui si sta muovendo Facebook , invece del vecchio modello in cui i dipendenti dovrebbero curare tale elenco in parte in base al loro proprie prospettive di fondo su quali argomenti hanno ritenuto "dovrebbero" essere più importanti.


10
-1. Adoro XKCD ma, senza alcun commento, temo che in questo thread sarà fuorviante. E ci vogliono un bel po 'di commenti per spiegare correttamente quali sono i problemi pertinenti a questo fumetto. Se fornisci una discussione appropriata, rimuoverò il voto negativo.
ameba dice di reintegrare Monica il

4
Non è vero che l'approccio frequentista non abbia le nozioni preconcette, sono codificate nella soglia per significatività statistica. ISTR c'è una buona citazione di Fisher su questo a seconda della natura dell'esperimento. Questo è interamente il problema con il frequentista nel cartone animato, non hanno semplicemente impostato un valore appropriato per quanto non hanno preso in considerazione la "conoscenza precedente" sul problema (che il sole che va in nova è estremamente improbabile) e adeguato il test di conseguenza. Utilizzando il 95% tutto il tempo fa parte del tanto criticato "null rituale". α
Dikran Marsupial,

4
Il "rituale nullo" è una cattiva applicazione delle statistiche dei frequentisti, ma non è un problema con il frequintismo in sé.
Dikran Marsupial,

2
@Dikran I tuoi commenti sembrano (erroneamente) equiparare "Frequentist" a "user of NHSTs". Questo è il tipo di confusione di cui mi sono preoccupato.
whuber

3
@luchonacho FWIW c'è una discussione sul fumetto XKCD qui stats.stackexchange.com/questions/43339/… Il punto prezioso che il fumetto (forse involontariamente) sottolinea è che la scienza è davvero più complessa e non possiamo semplicemente applicare il "null rituale "senza pensare alla conoscenza precedente.
Dikran Marsupial,

3

(Un'osservazione, solo tangenzialmente rilevante per la domanda e il sito.)

La probabilità riguarda lo stato oggettivo delle singole cose . Le cose non possono avere intenzione e ricevono il loro status dall'universo. Con una cosa, deve sempre accadere un evento (dandogli il suo status): l'evento è già lì compiuto, anche se non è ancora realmente accaduto - il futuro passato di una cosa, chiamato anche "destino" o contingenza.

Ancora una volta, con probabilità, il fatto dell'evento - essersi ancora verificato o no, non importa - è già lì [al contrario del significato che non c'è mai ]; e come tale è già diventato inutile e superfluo. Il fatto dovrebbe essere scartato e tale invalidazione è ciò che chiamiamo "l'evento è probabile". Qualsiasi fatto su una cosa porta in sé il suo lato non convincente primordiale, o la probabilità del fatto (anche il fatto realmente accaduto - lo riconosciamo con spillo di incredulità). In una certa misura siamo inevitabilmente "stanchi delle cose" pre-psichicamente. Resta quindi solo da quantificare quella parziale negazione della fattualità, se necessario un numero. Un modo per quantificare è contare. Un altro è quello di pesare . Un frequentatore esegue o immagina una serie di prove davanti a lui che si gira a faccia in su per vedere se l'evento si verifica realmente; lui conta. Un bayesiano considera una serie di motivi psicologici che si trascinano dietro di lui e che egli osserva; li pesa come cose. Entrambi gli uomini sono impegnati con il gioco mentale carica / scusa. Fondamentalmente, non c'è molta differenza tra loro.

La possibilità riguarda le potenzialità di me nel mondo. La possibilità è sempre mia (la possibilità della pioggia è il mio problema di optare per prendere un ombrello o bagnarmi) e non riguarda un oggetto (quello che sto considerando possibile o che ho la possibilità) ma il mondo intero per me. La possibilità è sempre 50/50 ed è sempre convincente, perché implica - o richiede prima o comporta dopo - la mia decisione su come comportarmi. Le cose stesse non hanno intenzioni e quindi possibilità. Non dovremmo confondere le nostre possibilità di queste cose per noi con le loro stesse probabilità di "determinismo stocastico". La probabilità non può mai essere "soggettiva" nel senso umano.


Un lettore attento può sentire nella risposta uno scavo mascherato alla risposta brillante in questo thread, dove @amoeba dice che pensa "there are almost no frequentists of the [probability definition] kind (P-frequentists)". Potrebbe essere invertito: i definitori di probabilità bayesiani non esistono come classi diverse. Perché, come ho ammesso, i bayesiani considerano i canti della realtà allo stesso modo dei frequentisti - come una serie di fatti; solo questi fatti non sono esperimenti, più presto ricordi di "verità" e "argomenti". Ma tali forme di conoscenza sono fattuali e possono solo essere contate o ponderate. La probabilità che erige non è sintetizzata come soggettiva, cioè anticipatoria ("bayesiana") a meno che l' aspettativa umana(possibilità) entra in scena per immischiarsi. E @amoeba lo lascia entrare con ansia quando immagina come "la moneta svanirà e il Sole diventerà una supernova".


0

Oh, sono stato un frequentatore per molti l'anno,
e ho passato tutto il mio tempo a suonare i dati a orecchio,
ma ora sto tornando con Bayes in grande magazzino,
e non suonerò mai più il frequentatore.

Perché non è mai no, no mai, mai più,
suonerò il frequentatore, no mai, non più!

Sono andato in un laboratorio dove ero solito consultare.
Mi hanno dato alcuni dati, ho detto 'p quello per noi',
ho detto 'Assolutamente no, Jose' con un po 'di sorriso, i
valori di P ed evidente non si riconciliano!

Coro

Ho detto che è il tuo precedente che dobbiamo far luce,
e gli occhi del ricercatore si spalancarono di gioia,
disse: "Le mie opinioni precedenti sono buone come il resto,
e di sicuro un fattore di Bayes è ciò che funzionerà meglio!"

Coro

Tornerò dai miei insegnanti, confesserò ciò che ho fatto
e chiederò loro di perdonare il loro figliol prodigo,
ma quando mi hanno perdonato, come spesso prima,
non suonerò più il frequentatore!

Coro

Ed è no, no mai, no no mai più,
suonerò il frequentatore, no mai, non più!

Fonte: AE Raftery, in The Bayesian Songbook, a cura di BP Carlin, su http://www.biostat.umn.edu/ . Cantato con la tradizionale melodia popolare di "The Wild Rover". Citato in Open University M347 Mathematical Statistics, Unit 9.


2
Questo dovrebbe essere piuttosto pubblicato qui: stats.stackexchange.com/questions/1337/statistics-jokes
Tim

Concordo con @Tim e -1 perché non vedo come questo si aggiunge alla presente discussione.
ameba dice di reintegrare Monica il
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.