Spero che qualcuno possa aiutarmi a risolvere un punto di confusione per me. Supponiamo di voler verificare se 2 serie di coefficienti di regressione sono significativamente diverse l'una dall'altra, con la seguente impostazione:
- , con 5 variabili indipendenti.
- 2 gruppi, con dimensioni approssimativamente uguali (anche se questo può variare)
- Migliaia di regressioni simili verranno eseguite simultaneamente, quindi è necessario eseguire una sorta di correzione di ipotesi multiple.
Un approccio che mi è stato suggerito è di utilizzare un test Z:
Un altro che ho visto suggerito su questa scheda è di introdurre una variabile fittizia per il raggruppamento e riscrivere il modello come:
, dove è la variabile di raggruppamento, codificata come 0, 1.
La mia domanda è: in che modo differiscono questi due approcci (ad es. Ipotesi diverse, flessibilità)? Uno è più appropriato dell'altro? Sospetto che questo sia piuttosto semplice, ma qualsiasi chiarimento sarebbe molto apprezzato.