Nella letteratura sui modelli gerarchici / multilivello ho letto spesso di "modelli nidificati" e "modelli non nidificati", ma cosa significa? Qualcuno potrebbe darmi qualche esempio o parlarmi delle implicazioni matematiche di questo fraseggio?
Nella letteratura sui modelli gerarchici / multilivello ho letto spesso di "modelli nidificati" e "modelli non nidificati", ma cosa significa? Qualcuno potrebbe darmi qualche esempio o parlarmi delle implicazioni matematiche di questo fraseggio?
Risposte:
Nidificato contro non nidificato può significare molte cose. Hai disegni nidificati contro disegni incrociati (vedi ad esempio questa spiegazione ). Hai modelli nidificati nel confronto tra modelli. Nidificato significa qui che tutti i termini di un modello più piccolo si presentano in un modello più grande. Questa è una condizione necessaria per l'utilizzo della maggior parte dei test di confronto dei modelli come i test del rapporto di verosimiglianza.
Nel contesto dei modelli multilivello penso sia meglio parlare di fattori nidificati e non nidificati. La differenza sta nel modo in cui i diversi fattori sono collegati tra loro. In un progetto nidificato, i livelli di un fattore hanno senso solo all'interno dei livelli di un altro fattore.
Supponi di voler misurare la produzione di ossigeno delle foglie. Assaggi un numero di specie di alberi e su ogni albero assaggi alcune foglie sul fondo, al centro e in cima all'albero. Questo è un disegno nidificato. La differenza per le foglie in una posizione diversa ha senso solo all'interno di una specie di albero. Quindi confrontare le foglie inferiori, le foglie medie e le foglie superiori su tutti gli alberi è insensato. O detto diversamente: la posizione delle foglie non dovrebbe essere modellata come effetto principale.
I fattori non nidificati sono una combinazione di due fattori non correlati. Supponi di studiare i pazienti e di essere interessato alla differenza di età e sesso. Quindi hai un fattore ageclass e un fattore fattore che non sono correlati. Dovresti modellare sia l'età che il sesso come effetto principale e, se necessario, puoi dare un'occhiata all'interazione.
La differenza non è sempre così chiara. Se nel mio primo esempio le specie arboree sono strettamente correlate nella forma e nella fisiologia, potresti considerare la posizione delle foglie anche come un effetto principale valido. In molti casi, la scelta di un disegno nidificato rispetto a un disegno non nidificato è più una decisione del ricercatore che un fatto reale.
I modelli nidificati rispetto a quelli non nidificati emergono nell'analisi congiunta e IIA . Considera il "problema del bus blu del bus rosso". Hai una popolazione in cui il 50% delle persone prende un'auto per lavorare e l'altro 50% prende l'autobus rosso. Cosa succede se aggiungi un bus blu con le stesse specifiche del bus rosso all'equazione? Un modello logit multinomiale prevede una quota del 33% per tutte e tre le modalità. Sappiamo intuitivamente che questo non è corretto in quanto il bus rosso e il bus blu sono più simili tra loro che all'auto e quindi prenderanno più quote l'uno dall'altro prima di prendere quota dall'auto. È qui che entra in gioco una struttura di nidificazione, che è tipicamente specificata come coefficiente lambda su alternative simili.
Ben Akiva ha messo insieme un bel set di diapositive che delineano la teoria su questo qui . Comincia a parlare di log nidificato intorno alla diapositiva 23.
Un modello è nidificato in un altro se è sempre possibile ottenere il primo modello vincolando alcuni dei parametri del secondo modello. Ad esempio, il modello lineare è nidificato all'interno del polinomio di 2 gradi , perché impostando b = 0, il 2-gradi. il polinomio diventa identico alla forma lineare. In altre parole, una linea è un caso speciale di un polinomio e quindi i due sono nidificati.
L'implicazione principale se due modelli sono nidificati è che è relativamente facile confrontarli statisticamente. In poche parole, con i modelli nidificati puoi considerare quello più complesso come costruito aggiungendo qualcosa a un "modello null" più semplice. Per selezionare il meglio da questi due modelli, quindi, devi semplicemente scoprire se quel qualcosa aggiunto spiega una quantità significativa di varianza aggiuntiva nei dati. Questo scenario equivale in realtà ad adattare prima il modello semplice e rimuovere la varianza prevista dai dati, quindi adattare il componente aggiuntivo del modello più complesso ai residui del primo adattamento (almeno con stima dei minimi quadrati).
I modelli non nidificati possono spiegare porzioni di varianza completamente diverse nei dati. Un modello complesso può persino spiegare una varianza minore rispetto a uno semplice, se quello complesso non include le "cose giuste" di cui dispone quello semplice. Quindi, in quel caso, è un po 'più difficile prevedere cosa accadrebbe sotto l'ipotesi nulla che entrambi i modelli spieghino i dati allo stesso modo.
Più precisamente, sotto l'ipotesi nulla (e date alcune assunzioni moderate), la differenza nella bontà di adattamento tra due modelli nidificati segue una distribuzione nota, la cui forma dipende solo dalla differenza nei gradi di libertà tra i due Modelli. Questo non è vero per i modelli non nidificati.
Due modelli non sono testati o separati se un modello non può essere ottenuto come limite dell'altro (o un modello non è un caso particolare dell'altro)
Hai chiesto informazioni sulla differenza tra modelli nidificati e non nidificati. Vedere:
Dove l'argomento dei modelli non nidificati o separati è stato trattato per la prima volta o il mio libro di prossima pubblicazione: Scelta di modelli separati o non nidificati .
Vedi una risposta più semplice in questo pdf . In sostanza, un modello nidificato è un modello con meno variabili rispetto a un modello completo. Un'intenzione è cercare risposte più parsimoniose.