Cosa significa che qualcosa ha buone proprietà frequentatrici?


12

Ho spesso sentito questa frase, ma non ho mai capito del tutto cosa significhi. La frase "buone proprietà per frequentatori" ha attualmente circa 2750 hit su google, 536 su scholar.google.com e 4 su stats.stackexchange.com .

La cosa più vicina a una chiara definizione viene dalla diapositiva finale di questa presentazione della Stanford University , che afferma

Il significato del riferire intervalli di confidenza al 95% è che "intrappoli" il vero parametro nel 95% delle affermazioni che fai, anche attraverso diversi problemi di stima. Questa è la caratteristica distintiva delle procedure di stima con buone proprietà frequentatrici: resistono al controllo quando vengono usate ripetutamente.

Riflettendo un po 'su questo, presumo che la frase "buone proprietà frequentiste" implichi una valutazione di un metodo bayesiano, e in particolare di un metodo bayesiano di costruzione di intervalli. Capisco che gli intervalli bayesiani hanno lo scopo di contenere il vero valore del parametro con probabilità . Gli intervalli di frequentist sono pensati per essere costruiti in modo tale che se il processo di costruzione dell'intervallo fosse ripetuto più volte circa degli intervalli conterrebbe il vero valore del parametro. Gli intervalli bayesiani in genere non promettono quale% degli intervalli coprirà il vero valore del parametro. Tuttavia, alcuni metodi bayesiani hanno anche la proprietà che se ripetuti più volte coprono il vero valore dipp*100%p*100%del tempo. Quando hanno quella proprietà, diciamo che hanno "buone proprietà frequentatrici".

È giusto? Immagino che ci debba essere qualcosa di più in questo, dato che la frase si riferisce a buone proprietà frequentiste , piuttosto che avere una buona proprietà frequentista .


1
Mi piace molto il modo in cui hai pensato a questa domanda. All'inizio Sir Harold Jeffreys cercò di costruire distribuzioni posteriori bayesiane che si comportassero come funzioni di verosimiglianza e quindi avessero buone proprietà frequentatrici. Quindi equivale a costruire una distribuzione precedente "uniforme". L'idea è che l'uso di un tale priore significa che il priore è neutro e non influenza l'inferenza. Quindi questo si applica a qualcosa di più del semplice far sembrare gli intervalli credibili come intervalli di confidenza. Ma Jeffreys ha avuto dei problemi perché c'erano casi in cui il precedente "uniforme" non era corretto.
Michael R. Chernick,

1
Improprio significa che la densità precedente non si integra con 1. Sembra che Jeffreys credesse che il metodo bayesiano dovesse essere giustificato concordando con il metodo frequentista. I bayesiani alla fine respinsero questa nozione perché il valore dell'approccio che sostengono è che ci sono informazioni precedenti che influenzano l'inferenza e quindi preferiscono usare preti "informativi" adeguati.
Michael R. Chernick,

2
@MichaelChernick: puoi fornire un riferimento preciso su Jeffreys che cerca proprietà frequentiste per gli stimatori di Bayes? Non ho mai sentito parlare di questa storia. E dubito anche che Jeffreys fosse preoccupato per l'uso di priori impropri, sono in tutta Teoria della Probabilità .
Xi'an,

Io AMO questa domanda!
Alexis,

1
@ Xi'an è un dato di fatto, per il modello beta-binomiale è il priore di Haldane (che è improprio) quello che porta alla stima del frequentatore, non il precedente di Jeffreys (che è corretto, in questo caso). Inoltre, non ho mai sentito dire che Jeffreys era alla ricerca di buone proprietà frequentatrici: pensavo stesse cercando priori oggettivi, e per obiettivo intendeva invariante sotto riparametrizzazione.
DeltaIV

Risposte:


3

Una cosa delicata riguardo alle buone proprietà del frequentatore è che sono proprietà di una procedura piuttosto che proprietà di un particolare risultato o inferenza. Una buona procedura frequentista produce inferenze corrette sulla proporzione specificata di casi a lungo termine, ma una buona procedura bayesiana è spesso quella che produce inferenze corrette nel singolo caso in questione.

Ad esempio, considera una procedura bayesiana che è "buona" in senso generale perché fornisce una distribuzione di probabilità posteriore o intervallo credibile che rappresenta correttamente la combinazione delle prove (funzione di verosimiglianza) con la distribuzione di probabilità precedente. Se il precedente contiene informazioni accurate (diciamo, piuttosto che un'opinione vuota o una qualche forma di precedente non informativo), quel posteriore o intervallo potrebbe comportare una migliore inferenza rispetto a un risultato frequentista dagli stessi dati. Meglio nel senso di portare a un'inferenza più accurata su questo caso particolare o ad un intervallo di stima più ristretto perché la procedura utilizza un precedente personalizzato contenente informazioni accurate. A lungo termine la percentuale di copertura degli intervalli e la correttezza delle inferenze è influenzata dalla qualità di ciascun priore.

Si noti che la procedura non specifica come ottenere il precedente e quindi la contabilità a lungo termine delle prestazioni dovrebbe presumibilmente assumere un precedente qualsiasi piuttosto che un precedente progettato su misura per ciascun caso.

Una procedura bayesiana può avere buone proprietà frequentiste. Ad esempio, in molti casi una procedura bayesiana con un precedente non informativo fornito dalla ricetta avrà proprietà da frequentatore abbastanza buone ad eccellenti. Tali buone proprietà sarebbero un incidente piuttosto che una caratteristica di progettazione e sarebbero una conseguenza diretta di una tale procedura che produce intervalli simili alle procedure del frequentatore.

Pertanto una procedura bayesiana può avere proprietà inferenziali superiori in un singolo esperimento pur avendo scarse proprietà frequentiste a lungo termine. Allo stesso modo, le procedure del frequentista con buone proprietà del frequentatore di lungo periodo spesso hanno scarse prestazioni nel caso di singoli esperimenti.


2
Non seguo Ad eccezione di Empirical Bayes, in tutte le procedure bayesiane ho visto che il precedente è stato scelto indipendentemente dai dati. Pertanto, quando si applica tale procedura a più set di dati provenienti dallo stesso processo di generazione dei dati (questo è il quadro frequentista) il bayesiano utilizzerà la stessa funzione di probabilità (il processo di generazione dei dati è lo stesso) e lo stesso precedente (il precedente è indipendente dai dati nella maggior parte delle procedure di Bayes). Naturalmente, poiché i dati cambiano ogni volta, il valore della probabilità cambia, ma la sua forma è la stessa. Ora, se ogni individuo [1/2]
DeltaIV

2
La stima [2/2] è più accurata, come può l'intera procedura essere meno accurata? Ciò è possibile solo se la stima bayesiana non è sempre più accurata. Tuttavia, poiché il precedente non è personalizzato in base ai dati osservati, non sono sicuro di cosa lo renda più o meno accurato per ogni singolo caso e / o "in media".
DeltaIV

@DeltaV Penso che tu abbia a che fare con il set di riferimento sbagliato. Le proprietà frequentista di una procedura si riferiscono all'esecuzione a lungo termine della procedura applicata in tutti i nuovi casi, non solo alle ripetizioni dell'esperimento specifico. Ecco perché le procedure dell'intervallo di confidenza per le proporzioni binomiali devono funzionare per tutti i valori del parametro, non solo per il valore relativo a qualsiasi istanza particolare in cui viene utilizzata la procedura. Questo tipo di "lungo periodo" significa che il precedente personalizzato appropriato per il caso in questione sarà inappropriato a lungo termine.
Michael Lew,

hai ragione che una procedura di confidenza frequentista deve avere la copertura nominale per tutti i valori del parametro sconosciuto. Ciò è stato chiaramente specificato da Newman & Pearson, ed è spesso trascurato oggi. Tuttavia, quando si sceglie il precedente, non si sa quale sia il valore "vero" del parametro. Hai solo il tuo campione e il precedente dovrebbe essere indipendente dal campione. Quindi non vedo ancora chiaramente come personalizzare il precedente in base al campione. Puoi fare un esempio pratico?
DeltaIV,

@DeltaIV Se so che l'attuale parametro di interesse è stato stimato nello studio precedente, posso modellare un precedente informativo basato su tale stima. Quel precedente sarà appropriato per questa analisi corrente, ma non esiste un precedente informativo adeguato equivalente disponibile per l'insieme nozionale di applicazioni del metodo a lungo termine. Quindi l'analisi può avere proprietà molto migliori nel caso reale isolato di quanto sembrerebbe avere nel lungo periodo frequentista.
Michael Lew,

2

Risponderei che la tua analisi è corretta. Per fornire qualche informazione in più, vorrei citare i priori corrispondenti.

I priori corrispondenti sono in genere priori progettati per costruire modelli bayesiani con proprietà frequentatrici. In particolare, sono definiti in modo tale che gli intervalli hpd ottenuti soddisfino la copertura frequentista dell'intervallo di confidenza (quindi il 95% del 95% hpd contiene i valori reali a lungo termine). Si noti che, nel 1 ° giorno, ci sono soluzioni analitiche: i priori di Jeffreys sono corrispondenti a priori. In una dimensione superiore, questo non è necessario nel caso (a mia conoscenza, non vi è alcun risultato che dimostri che non è mai così).

In pratica, questo principio di abbinamento viene talvolta applicato anche per ottimizzare il valore di alcuni parametri di un modello: i dati di verità di base vengono utilizzati per ottimizzare questi parametri, nel senso che i loro valori massimizzano la copertura frequentista degli intervalli credibili risultanti per il parametro di interesse . Dalla mia esperienza, questo potrebbe essere un compito molto sottile.


0

Se posso apportare un contributo, vorrei prima aggiungere un chiarimento, quindi rispondere direttamente alla tua domanda. Ci sono molte confusioni sull'argomento (proprietà frequestiste della procedura bayesiana) e persino disaccordo tra gli specialisti. Il primo malinteso è "Gli intervalli bayesiani hanno lo scopo di contenere il vero valore del parametro con probabilità ." Se sei puro bayesiano (uno che non adotta alcuna nozione frequentista per valutare la procedura bayesiana), non esiste un "vero parametro". Le principali quantità di interesse che sono parametri fissi nel mondo frequentista sono variabili casuali nel mondo bayesiano. Come bayesiano, non recuperi il vero valore dei parametri, ma la distribuzione dei "parametri", o i loro momenti.p

Ora, per rispondere alla tua domanda: no, non implica alcuna valutazione del metodo bayesiano. Saltare le sfumature e concentrarsi sulla procedura di stima per renderlo semplice: il frequentismo in statistica è quell'idea di stimare una quantità fissa sconosciuta, o testare un'ipotesi, e valutare tale procedura rispetto a un'ipotetica ripetizione di essa. È possibile adottare molti criteri per valutare una procedura. Ciò che lo rende un criterio frequentista è che ci si preoccupa di ciò che accade se si adotta ripetutamente la stessa procedura. Se lo fai, ti preoccupi delle proprietà del frequentatore. In altre parole: "quali sono le proprietà del frequentatore?" significa "cosa succede se ripetiamo ripetutamente la procedura?" Ora, ciò che rende buone tali proprietà frequentatriciè un altro livello di criteri. Le proprietà del frequentatore più comuni che sono considerate buone proprietà sono la coerenza (in una stima, se continui a campionare lo stimatore converge al valore fisso che stai stimando), efficienza (se continui a campionare, la varianza dello stimatore andrà a zero , quindi sarai sempre più preciso), probabilità di copertura(in molte ripetizioni della procedura, un intervallo di confidenza al 95% conterrà il valore reale al 95% del tempo). I primi due sono chiamati grandi proprietà del campione, il terzo è la proprietà di Neyman-autenticamente frequentista, nel senso che non ha necessariamente bisogno di usare risultati asintotici. Quindi, in sintesi, nel quadro del frequentista, esiste un valore vero e sconosciuto. Lo stimhi e hai sempre (tranne in un raro incidente fortunato) sbagliato nella stima, ma stai cercando di salvarti richiedendo che almeno sotto una ripetizione ipoteticamente indefinita della tua stima, avresti sempre meno torto osai che avresti ragione un certo numero di volte. Non discuterò se abbia senso o meno, o le ipotesi aggiuntive richieste per giustificarlo, dato che non erano le tue domande. Concettualmente, questo è ciò a cui si riferiscono le proprietà del frequentatore e quali buoni mezzi in generale in tale contesto.

Chiuderò indicandoti questo documento, in modo che giudichi da solo se ha senso e cosa significa una procedura bayesiana per avere buone proprietà frequentatrici (troverai più riferimenti lì):

  • Little, R., e altri, (2011). Bayes calibrati, per statistiche in generale e dati mancanti in particolare. Statistical Science, 26 (2), 162–174.
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.