Ho calcolato correttamente questi rapporti di probabilità?


18

Sono l'autore del pacchetto ez per R e sto lavorando ad un aggiornamento per includere il calcolo automatico dei rapporti di verosimiglianza (LR) nell'output degli ANOVA. L'idea è di fornire un LR per ogni effetto analogo al test di quell'effetto che l'ANOVA ottiene. Ad esempio, l'LR per l'effetto principale rappresenta il confronto di un modello nullo con un modello che include l'effetto principale, l'LR per un'interazione rappresenta il confronto di un modello che include entrambi gli effetti principali dei componenti rispetto a un modello che include sia gli effetti principali che la loro interazione, ecc.

Ora, la mia comprensione del calcolo LR viene da Glover & Dixon ( PDF ), che copre i calcoli di base, nonché le correzioni per la complessità, e l'appendice a Bortolussi & Dixon ( appendice PDF ), che copre i calcoli che coinvolgono variabili di misure ripetute. Per testare la mia comprensione, ho sviluppato questo foglio di calcolo , che prende i dfs e le SS da un esempio ANOVA (generato da un disegno 2 * 2 * 3 * 4 usando dati falsi) e passa attraverso il calcolo dell'LR per ogni effetto.

Lo apprezzerei molto se qualcuno con un po 'più di confidenza con tale calcolo potesse dare un'occhiata e assicurarsi che ho fatto tutto correttamente. Per quelli che preferiscono il codice astratto, ecco il codice R che implementa l'aggiornamento a ezANOVA () (vedi esp. Righe 15-95).

Risposte:


3

Sebbene il ragionamento sul calcolo dell'LR dai valori SS sia abbastanza equo, un metodo dei minimi quadrati è equivalente ma non uguale alla stima della probabilità. (La differenza può essere illustrata, ad esempio, nel calcolo del se, che è diviso per (n-1) in un approccio dei minimi quadrati e diviso per n nella massima verosimiglianza. La stima della verosimiglianza massima è quindi coerente, ma leggermente distorta ).

Ciò ha alcune implicazioni: è possibile calcolare l'LR in quanto la probabilità è proporzionale a 1S, ma ciò non ti dà la probabilità del tuo stesso modello anova. Ti dice solo qualcosa sul rapporto. Poiché l'AIC è definito classicamente in termini di probabilità, non sono sicuro che tu possa utilizzare l'AIC come desideri.

Ho esaminato il foglio di calcolo, ma i valori per "LR non corretto all'interno" (non sto nemmeno seguendo completamente quello che stai cercando di calcolare lì) mi sembrano altamente improbabili.

Una nota a margine, la potenza del test LR è che puoi semplicemente contrastare i modelli che desideri, non devi farlo per tutti loro (il che riduce l'errore di multitest). Se lo fai per ogni termine, il tuo LR è completamente equivalente a un test F, e nel caso dei minimi quadrati, per quanto ne so anche numericamente sullo stesso.

Il tuo miglio può variare, ma non sono mai stato fiducioso nel mescolare concetti di due diversi framework (ovvero minimi quadrati contro massima probabilità). Personalmente, riferirei le statistiche F e implementerei l'LR in una funzione che consente di confrontare i modelli (es. La funzione anova per i modelli lme che fa esattamente questo).

I miei 2 centesimi.

PS: ho esaminato il tuo codice, ma non sono riuscito a capire davvero tutte le variabili. Se annotassi il tuo codice usando i commenti, ciò renderebbe di nuovo la vita un po 'più semplice. Inoltre, il foglio EXCEL non è il più semplice da capire. Controllerò più tardi per vedere se riesco a ricavarne qualcosa.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.