Significato reale dell'ellisse di fiducia

12

Leggendo il vero significato dell'ellisse di confidenza al 95%, tendo a trovare 2 spiegazioni:

L'ellisse che contiene il 95% dei dati
Non quanto sopra, ma l'ellisse che spiega la varianza dei dati. Non sono sicuro di aver capito bene, ma sembrano significare che se arriva un nuovo punto dati, c'è una probabilità del 95% che la nuova varianza rimanga nell'ellisse.

Puoi far luce?

confidence-interval ellipse

— Kenny
fonte

15

In realtà, nessuna delle due spiegazioni è corretta.

Un'ellisse di confidenza ha a che fare con parametri di popolazione non osservati , come la vera media della popolazione della distribuzione bivariata. Un'ellisse di confidenza al 95% per questa media è in realtà un algoritmo con la seguente proprietà: se dovessi replicare il campionamento dalla distribuzione sottostante molte volte e ogni volta calcolare un'ellisse di confidenza, allora il 95% delle ellissi così costruite conterrebbe il sottostante significare. (Si noti che ogni campione produrrebbe ovviamente un'ellisse diversa.)

Pertanto, un'ellisse di confidenza di solito non conterrà il 95% delle osservazioni. Infatti, con l'aumentare del numero di osservazioni, la media sarà di solito sempre meglio stimata, portando a ellissi sempre più piccole, che a loro volta contengono una proporzione sempre più piccola dei dati reali. (Sfortunatamente, alcune persone calcolano l'ellisse più piccola che contiene il 95% dei loro dati, che ricorda un quantile, che di per sé è abbastanza OK ... ma poi continua a chiamare questa "ellisse quantile" un "ellisse di confidenza", che, come vedi, crea confusione.)

La varianza della popolazione sottostante si riferisce all'ellisse della fiducia. Una varianza elevata significherà che i dati sono ovunque, quindi la media non è ben stimata, quindi l'ellisse di confidenza sarà più grande di se la varianza fosse più piccola.

Naturalmente, possiamo calcolare le ellissi di confidenza anche per qualsiasi altro parametro di popolazione che potremmo voler stimare. Oppure potremmo esaminare altre regioni di confidenza oltre le ellissi, specialmente se non conosciamo il parametro stimato da distribuire (asintoticamente) normalmente.

L'analogo unidimensionale dell'ellisse di confidenza è l' intervallo di confidenza e la consultazione delle domande precedenti in questo tag è utile. La nostra attuale domanda più votata in questo tag è particolarmente interessante: perché un IC al 95% non implica una probabilità del 95% di contenere la media? La maggior parte della discussione è valida anche per analoghi di dimensioni superiori dell'intervallo di confidenza unidimensionale.

— Stephan Kolassa
fonte

1

Dipende dall'area a cui si applica questo concetto. Ciò che è stato detto sopra è vero per le statistiche, ma quando applichiamo le statistiche ad altri argomenti le cose sono leggermente diverse. In biomeccanica, ad esempio, usiamo il termine ellisse di confidenza (anche se si discute se debba essere un'ellisse di previsione) come tecnica per misurare il centro di spostamento della pressione quando un soggetto si trova su una piattaforma di forza. Quindi si suppone che l'ellisse disegnata attorno ai due assi (maggiore e minore) contenga il 95% dei punti dati che rappresentano il centro di spostamento della pressione nel tempo di una prova.

— Cathrine Katsigianni
fonte