Conseguenze della disuguaglianza di correlazione gaussiana per il calcolo degli intervalli di confidenza congiunti


31

Secondo questo articolo molto interessante su Quanta Magazine: "Una prova a lungo cercata, trovata e quasi persa" , - è stato dimostrato che dato un vettore con un multivariato Distribuzione gaussiana e dati intervalli centrati attorno alle medie dei componenti corrispondenti di , quindix=(x1,,xn)I1,,Inx

p(x1I1,,xnIn)i=1np(xiIi)

(Disuguaglianza di correlazione gaussiana o GCI; vedere https://arxiv.org/pdf/1512.08776.pdf per la formulazione più generale).

Questo sembra davvero bello e semplice, e l'articolo dice che ha conseguenze per gli intervalli di confidenza congiunti. Tuttavia, mi sembra abbastanza inutile in questo senso. Supponiamo di stimare parametri e abbiamo trovato stimatori che sono (forse asintoticamente) congiuntamente normali (ad esempio, lo stimatore MLE) . Quindi, se computo intervalli di confidenza al 95% per ciascun parametro, il GCI garantisce che l'ipercubo è una regione di confidenza congiunta con copertura non inferiore a ... che è anche copertura abbastanza bassa per moderato .θ1,,θnθ1^,,θn^I1×In(0.95)nn

Pertanto, non sembra un modo intelligente per trovare regioni di confidenza comuni: la solita regione di confidenza per un gaussiano multivariato, cioè un iperellipsoide, non è difficile da trovare se la matrice di covarianza è nota ed è più nitida. Forse potrebbe essere utile trovare regioni di fiducia quando la matrice di covarianza è sconosciuta? Potete mostrarmi un esempio della pertinenza di GCI per il calcolo delle regioni comuni di fiducia?


2
Hai l'idea giusta. Gli intervalli di confidenza individuali devono essere molto superiori al 95% affinché la regione comune raggiunga il 95%. Ciascuno deve essere almeno 0,95 elevato all'1 / n potenza.
Michael R. Chernick,

1
Una correzione piccola ma importante: gli intervalli devono essere tutti centrati attorno allo zero, cioè . IkIk={x:|x|xk}
Alex R.

1
@amoeba Non sono preoccupato per la difficoltà della prova, ma per la sua rilevanza per le statistiche applicate. Se prendere in considerazione un iperrangolo è più facile mostrare tale rilevanza, bene. Se invece pensi che questa disuguaglianza diventa utile nella pratica solo quando viene considerato un poligono arbitrario, abbastanza giusto. Accetterò una risposta che dice "se si considerano solo i rettangoli, GCI non è uno strumento molto utile per uno statistico applicato, perché .... Ma se si considerano i poligoni arbitrari, allora diventa rilevante, perché ..."
DeltaIV,

1
Volevo modificare e guardare nei documenti con le prove, ma ora non sono più sicuro al 100% se l'ipertrangolo è un caso speciale / facile o una formulazione equivalente. Per ora lo lascerò e forse tornerò qui più tardi.
ameba dice Ripristina Monica il

1
gli iper rettangoli centrati sull'origine (dove con centrato sull'origine intendo dire che ciascuno degli intervalli 1D, il cui prodotto cartesiano definisce l'ipertogramma, è simmetrico rispetto all'origine) sono sicuramente almeno un caso speciale (non ho idea se siano un caso equivalente). Secondo la carta arXiv, la disuguaglianza è valida per tutti i set convessi simmetrici. Un hyperrectangle è un insieme convesso e se è centrato sull'origine nel senso sopra definito, allora è simmetrico, cioè, . Hx=(x1,,xn)HxH
DeltaIV

Risposte:


2

Penso che la domanda sia più pertinente. In un certo senso, stai esaminando più test di ipotesi e confrontandoli con l'esecuzione di più test di ipotesi.

Sì, in effetti esiste un limite inferiore che è il prodotto dei valori p dei test che assumono l'indipendenza. Questa è la base per gli aggiustamenti dei valori di p nei test di ipotesi multipla come Bonferroni o Holm. Ma le regolazioni di Bonferroni e Holm (assumendo l'indipendenza) sono test di potenza particolarmente bassa.

In pratica si può fare molto meglio (e ciò avviene tramite Bootstrap, si veda ad esempio il Bootstrap Reality Check di H White, i documenti di Romano-Wolf e il più recente set di documenti sui Set modello di confidenza). Ognuno di questi è un tentativo di test di ipotesi di potenza superiore (ad esempio, usando la correlazione stimata per fare meglio che semplicemente usando questo limite inferiore) e di conseguenza molto più rilevante.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.