Ho letto le molte eccellenti discussioni sul sito relative all'interpretazione degli intervalli di confidenza e degli intervalli di previsione, ma un concetto è ancora un po 'sconcertante:
Considera il framework OLS e abbiamo ottenuto il modello montato . Ci viene dato un e ci viene chiesto di prevederne la risposta. Calcoliamo e, come bonus, forniamo anche un intervallo di previsione del 95% attorno alla nostra previsione, ottenendo una formula per i limiti di previsione in un modello lineare . Chiamiamo questo intervallo di predizione PI. x*x*T β
Ora, quale dei seguenti (o nessuno dei due) è l'interpretazione corretta di PI?
- Per in particolare, trova all'interno di PI con una probabilità del 95%. y ( x ∗ )
- Se ci viene dato un gran numero di s, questa procedura per calcolare i PI coprirà le risposte vere il 95% delle volte.
Dalla formulazione di @ gung nell'intervallo di predizione della regressione lineare , sembra che il primo sia vero (anche se potrei benissimo interpretare male). L'interpretazione 1 mi sembra poco intuitiva (nel senso che stiamo traendo conclusioni bayesiane dall'analisi del frequentista), ma se è corretto, è perché stiamo prevedendo la realizzazione di una variabile casuale rispetto alla stima di un parametro ?
(Modifica) Domanda bonus: Supponiamo di sapere qual è il vero , ovvero il processo che genera i dati, quindi potremmo parlare delle probabilità riguardo a una previsione particolare, dato che stiamo solo guardando ?ϵ
Il mio ultimo tentativo in questo senso: possiamo "decomporre concettualmente" (usando la parola molto liberamente) un intervallo di predizione in due parti: (A) un intervallo di confidenza attorno alla risposta media prevista, e (B) una raccolta di intervalli che sono solo quantili intervalli del termine di errore. (B) possiamo fare affermazioni probabilistiche, subordinatamente alla conoscenza della vera media prevista, ma nel suo complesso, possiamo trattare gli intervalli di previsione solo come CI per i frequentisti attorno ai valori previsti. È in qualche modo corretto?