Conosco il concetto di variabili categoriche e la rispettiva codifica delle variabili fittizie che ci consente di adattarci a un livello come base per evitare collinearità. Conosco anche come interpretare le stime dei parametri da tali modelli: il cambiamento previsto nel risultato per un dato livello adattato del predittore categorico, relativamente alla categoria di base.
Ciò di cui non sono sicuro è come interpretare un insieme di variabili indipendenti che sono proporzioni che si sommano a una . Abbiamo di nuovo collinearità se adattiamo tutte le proporzioni nel modello, quindi presumibilmente dovremmo lasciare una categoria fuori dalla linea di base. Presumo anche che esaminerei il SS di tipo III per il test generale del significato di questa variabile. Tuttavia, come interpretiamo le stime dei parametri per quei livelli che si adattano al modello rispetto a quelli considerati basali?
Un esempio : a livello di codice postale, la variabile indipendente è la proporzione di rocce metamorfiche, ignee e sedimentarie. Come forse saprai, questi sono i tre principali tipi di roccia e tutte le rocce sono classificate come una di queste. Pertanto, le proporzioni di tutte e tre le somme sono 1. Il risultato è il livello medio di radon in un rispettivo codice postale.
Se dovessi adattare, diciamo, le proporzioni metamorfiche ed ignee come predittori nel modello, lasciando sedimentario come base, un test F di tipo III SS generale dei due livelli adattati significherebbe se il tipo di roccia, nel suo insieme, è importante predittore del risultato (livello medio di radon). Quindi, ho potuto esaminare i singoli valori p (in base alla distribuzione t ) per determinare se uno o entrambi i tipi di roccia erano significativamente diversi dalla linea di base.
Tuttavia, quando si tratta di stime dei parametri, il mio cervello continua a voler interpretarli puramente come il cambiamento previsto nel risultato tra gruppi (tipi di roccia), e non capisco come incorporare il fatto che siano adatti come proporzioni .
Se la stima per metamorfico fosse, diciamo, 0.43, l'interpretazione non è semplicemente che il livello medio di radon previsto aumenta di 0,43 unità quando la roccia è metamorfica rispetto a sedimentaria. Tuttavia, l'interpretazione non è anche semplicemente per una sorta di aumento di unità (diciamo 0.1) nella proporzione del tipo di roccia metamorfica, perché ciò non riflette il fatto che è anche relativo alla linea di base ( sedimentaria ) e, inoltre, che cambia la proporzione di metamorfico modifica intrinsecamente la proporzione dell'altro livello di roccia adatto al modello, ignea .
Qualcuno ha una fonte che fornisce l'interpretazione di un tale modello o potresti fornire un breve esempio qui?