Intervalli di confidenza trasformati all'indietro


11

Dopo essermi imbattuto in questa discussione, sollevo la questione delle convenzioni sugli intervalli di confidenza trasformate a ritroso.

Secondo questo articolo, la copertura nominale trasformata indietro CI per la media di una variabile casuale log-normale è:

LCL(X)=exp(Y+var(Y) UCL(X)=exp(Y+var(Y)2+zvar(Y)n+var(Y)22(n1))  LCL(X)=exp(Y+var(Y)2zvar(Y)n+var(Y)22(n1))

/ e non l'ingenuo /exp((Y)+zvar(Y))

Ora, quali sono tali elementi della configurazione per le seguenti trasformazioni:

  1. ex 1 / 3xx1/3
  2. arcsin(x)
  3. log(x1x)
  4. 1/x

Che ne dici dell'intervallo di tolleranza per la variabile casuale stessa (intendo un singolo valore del campione estratto casualmente dalla popolazione)? C'è lo stesso problema con gli intervalli retro-trasformati o avranno la copertura nominale?


1
Vedi l' espansione di Taylor per i momenti delle funzioni di camper e il metodo Delta . Ma è necessaria cura. Vedi ad esempio la discussione qui e [qui] (stats.stackexchange.com/questions/41896/varx-is-known-how-to-calculate-var1-x/). La ricerca sulle serie di Taylor presenterà numerosi esempi e discussioni utili.
Glen_b

Ho apportato modifiche sostanziali alle tue formule. Per favore controlla che non abbia sbagliato nessuno. Nel mio commento precedente (mi dispiace per il link formattato in modo errato lì) - vedi anche il commento precauzionale sotto la risposta qui
Glen_b -Reinstate Monica

Grazie. Anche se difficilmente riesco a pubblicare qualcosa senza essere modificato con quelle espressioni fantasiose.
Germaniawerks,

Risposte:


6

Perché stai facendo delle trasformazioni indietro? Questo è fondamentale per rispondere alla tua domanda perché in alcuni casi l'ingenua trasformazione è la risposta giusta. In effetti, penso che sosterrò che, se l'ingenua trasformazione della schiena non è la risposta giusta, allora non dovresti affatto trasformare la schiena.

Trovo che il problema generale della trasformazione della schiena sia estremamente problematico e spesso pieno di pensieri confusi. Guardando l'articolo che hai citato, cosa li fa pensare che sia una domanda ragionevole che il CI trasformato indietro non catturi la media originale? È un'interpretazione errata di valori trasformati indietro. Pensano che la copertura dovrebbe essere per l'analisi diretta nello spazio trasformato indietro. E poi creano una trasformazione posteriore per correggere quell'errore invece della loro interpretazione.

Se si eseguono le analisi sui valori di registro, le stime e le inferenze si applicano a tali valori di registro. Finché si considera che qualsiasi schiena trasformi una rappresentazione di come appare quell'analisi del registro nello spazio esponenziale, e solo così, allora si sta bene con l'approccio ingenuo. In effetti, è preciso. Questo è vero per ogni trasformazione.

Fare quello che stanno facendo risolve il problema di provare a trasformare l'IC in qualcosa che non è, un CI dei valori trasformati. Questo è pieno di problemi. Considera il legame in cui ti trovi ora, i due possibili elementi della configurazione, uno nello spazio trasformato in cui esegui le analisi e uno nella parte posteriore trasformata, fanno affermazioni molto diverse su dove si trova il mu probabile nell'altro spazio. La trasformazione posteriore consigliata crea più problemi di quanti ne risolva.

La cosa migliore da estrarre da quel documento è che quando decidi di trasformare i dati ha un impatto più profondo del previsto sul significato delle tue stime e inferenze.


Potresti spiegarlo ulteriormente? Mi sembra che il problema sia l'ingenuo CI che dà quello della media geometrica, piuttosto che l'aritmetica. Il che è ciò che implicherebbe che sia strettamente più piccolo, come si suol dire, e quindi l'incoerenza e la scarsa copertura.
Germaniawerks,

Incoerenza con cosa? Se hai intenzione di analizzare direttamente la tua distribuzione esponenziale e vuoi conoscere la media aritmica, allora sì, è scarsa copertura per questo. Ma se avessi voluto farlo, avresti dovuto farlo. Se hai intenzione di registrare trasforma la tua distribuzione e analizza gli esponenti, allora è esattamente la giusta copertura per quello.
Giovanni,

Non riesco a capire perché ti opponga al metodo nell'articolo. Le simulazioni mostrano che funziona bene, mentre il metodo ingenuo sta andando peggio dell'approccio "limite centrale".
Germaniawerks,

1
Lo dimostrano fare meglio per quello che vogliono che sia. Il metodo ingenuo funziona bene per quello che è. Guarda la simulazione nella sezione 5. Hanno impostato una media di distribuzione 5, che ha un esponente di 148,4. Quindi proseguono discutendo la copertura della media di 244,6 !! Sarebbe importante solo se hai intenzione di modellare la media della distribuzione originale, NON i log. Stanno cercando di renderlo qualcosa che non lo è. Il calcolo ingenuo ha una copertura perfettamente precisa rispetto alla media del registro, 5. Nessuno degli altri CI ha il 95% di CI di quel valore ed è quello che stai analizzando.
Giovanni,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.