Nella varianza della standardizzazione è noto mentre nella studentizzazione non è noto e quindi stimato? Grazie.
Nella varianza della standardizzazione è noto mentre nella studentizzazione non è noto e quindi stimato? Grazie.
Risposte:
Un breve riassunto. Dato un modello , dove è , e , dove è la "matrice del cappello". I residui sono La varianza della popolazione è sconosciuta e può essere stimata da , l'errore quadratico medio.X n × p β = ( X ' X ) - 1 x ' y y = X β = X ( X ' X ) - 1 x ' y = H y H = X ( X ' X ) - 1 X ' e = y -σ2MSE
I residui semistudentizzati sono definiti come ma, poiché la varianza dei residui dipende sia da che da , la loro varianza stimata è: dove è l' elemento diagonale della matrice del cappello. σ2XV(ei)=MSE(1-hii)hiii
I residui standardizzati , detti anche residui internazionalizzati , sono:
Tuttavia, i singoli e non sono indipendenti, quindi non può avere una distribuzione . La procedura è quindi di eliminare la esima osservazione, misura la funzione di regressione ai rimanenti osservazioni, e ottenere nuove s' che possono essere indicate con . La differenza: si chiama residuo eliminato . Un'espressione equivalente che non richiede un nuovo è: indica il nuovo e con e M S E r i t i n - 1 y y i ( i ) D i = y i - y i ( i ) d i = e i
Vedi Kutner et al., Modelli statistici lineari applicati , Capitolo 10.
Modifica: devo dire che la risposta di rpierce è perfetta. Pensavo che il PO riguardasse i residui standardizzati e studentizzati (e la divisione per deviazione standard della popolazione per ottenere i residui standardizzati mi sembrava strano, ovviamente), ma mi sbagliavo. Spero che la mia risposta possa aiutare qualcuno anche se OT.
Nelle scienze sociali è in genere ha detto che i punteggi Studentizated utilizza calcolo / di Gosset di Student per la stima del / deviazione standard varianza della popolazione dal campione varianza / deviazione standard ( ). Al contrario, si dice che i punteggi standardizzati (un nome, un particolare tipo di statistica, il punteggio Z) utilizzino la deviazione standard della popolazione? ( ).
Tuttavia, sembra che ci siano alcune differenze terminologiche tra i campi (vedere i commenti su questa risposta). Pertanto, si dovrebbe procedere con cautela nel fare queste distinzioni. Inoltre, i punteggi studentizzati vengono raramente chiamati tali e si vedono in genere valori "studentizzati" nel contesto della regressione. @Sergio fornisce dettagli su quei tipi di residui cancellati studentizzati nella sua risposta.
Sono in ritardo nel rispondere a questa domanda !! Ma non riuscivo a trovare la risposta in un linguaggio molto semplice, così umile tentativo di rispondere a questa.
Perché facciamo la standardizzazione? Immagina di avere due modelli: uno prevede la follia dalla quantità di tempo speso nello studio delle statistiche mentre altri predice il log (follia) con la quantità di tempo nelle statistiche.
sarebbe difficile capire che i residui sono entrambi in unità diverse. Quindi li standardizziamo (teoria simile al punteggio Z)
Residui standardizzati: - Quando i residui sono divisi per una stima della deviazione standard. In generale se il valore assoluto> 3 è motivo di preoccupazione.
Usiamo questo per indagare sui valori anomali nel modello.
Residuo studentizzato: lo usiamo per studiare la stabilità del modello.
Il processo è semplice. Rimuoviamo i singoli casi di test dal modello e scopriamo il nuovo valore previsto. La differenza tra il nuovo valore e il valore osservato originale può essere standardizzata dividendo l'errore standard. questo valore è Residuo studentizzato
Per maggiori informazioni sulla scoperta di statistiche usando R - http://www.statisticshell.com/html/dsur.html