Domanda
Se sono IID, quindi calcola , dove .
Tentativo : verificare se il seguito è corretto.
Diciamo, prendiamo la somma di quelle aspettative condizionali tali che,
Significa che ogni poiché X_1, \ ldots, X_n sono IID.
Pertanto, . È corretto?
Domanda
Se sono IID, quindi calcola , dove .
Tentativo : verificare se il seguito è corretto.
Diciamo, prendiamo la somma di quelle aspettative condizionali tali che,
Significa che ogni poiché X_1, \ ldots, X_n sono IID.
Pertanto, . È corretto?
Risposte:
L'idea è giusta, ma c'è una questione di esprimerla un po 'più rigorosamente. Mi concentrerò quindi sulla notazione e sull'esposizione dell'essenza dell'idea.
Cominciamo con l'idea di scambiabilità:
Una variabile casuale è scambiabile quando le distribuzioni delle variabili permutate sono tutti uguali per ogni possibile permutazione .
Chiaramente iid implica intercambiabile.
Per notazione, scrivi per il componente di e lascia
Sia qualsiasi indice e sia qualsiasi permutazione degli indici che invia a (Tale esiste perché si può sempre solo scambiare e ) La scambiabilità di implica
perché (nella prima disuguaglianza) abbiamo semplicemente sostituito con il vettore identicamente distribuito Questo è il nocciolo della questione.
conseguentemente
da dove
Questa non è una prova (e +1 alla risposta di @ whuber), ma è un modo geometrico per costruire un po 'di intuizione sul perché è una risposta sensata.
Let e in modo da . Stiamo quindi condizionando l'evento che per qualche , quindi questo è come disegnare gaussiani multivariati supportati su ma solo guardando quelli che finiscono nello spazio affine . Quindi vogliamo conoscere la media dellecoordinate dei punti che atterrano in questo spazio affine (non importa se si tratta di un sottoinsieme zero di misura).
Conosciamo
Questo ci dà una situazione come l'immagine qui sotto:
L'idea chiave: prima immagina la densità sul sottospazio affine . La densità di è simmetrica attorno a poiché . La densità sarà anche simmetrica su poiché anche è simmetrica sulla stessa linea e il punto attorno al quale è simmetrica è l'intersezione delle linee e . Questo accade per .
Per immaginare possiamo immaginare il campionamento più e più volte, e quindi ogni volta che otteniamo un punto in prendiamo solo la coordinata e la salviamo. Dalla simmetria della densità su la distribuzione delle coordinate sarà simmetrica e avrà lo stesso punto centrale di . La media di una distribuzione simmetrica è il punto centrale della simmetria, quindi questo significa e che poiché e possono essere modificati senza influire su nulla.
In dimensioni più elevate questo diventa difficile (o impossibile) da visualizzare esattamente, ma si applica la stessa idea: abbiamo un gaussiano sferico con una media nell'intervallo di e stiamo osservando un sottospazio affine che è perpendicolare a quello. Il punto di equilibrio della distribuzione sul sottospazio sarà comunque l'intersezione tra e che è a e la densità è ancora simmetrica quindi questo punto di equilibrio è di nuovo la media.
Ancora una volta, questa non è una prova, ma penso che dia un'idea decente del motivo per cui ti aspetteresti questo comportamento in primo luogo.
Oltre a ciò, come hanno notato alcuni come @StubbornAtom, questo non richiede in realtà che sia gaussiano. In 2-D, nota che se è scambiabile, allora (più in generale, ), quindi deve essere simmetrico la linea . Abbiamo anche quindi tutto ciò che ho detto sull'idea chiave nella prima immagine è ancora valido. Ecco un esempio in cui la stanno IID da un modello misto gaussiana. Tutte le linee hanno lo stesso significato di prima.
Penso che la tua risposta sia giusta, anche se non sono del tutto sicuro della linea killer nella tua prova, sul fatto che sia vera "perché sono iid". Un modo più prolisso per la stessa soluzione è il seguente:
Pensa a cosa significa effettivamente . Sai che hai un campione con N letture e che la loro media è T. Ciò che questo significa in realtà è che ora la distribuzione sottostante da cui sono stati campionati non conta più (noterai che non hai mai usato il fatto che fosse campionato da un gaussiano nella tua prova).
è la risposta alla domanda, se hai effettuato il campionamento dal tuo campione, con la sostituzione più volte, quale sarebbe la media ottenuta. Questa è la somma di tutti i possibili valori, moltiplicata per la loro probabilità, oche equivale a T.