Sto insegnando un corso di statistica di base e oggi tratterò il test chi-quadrato di indipendenza per due categorie e il test di omogeneità. Questi due scenari sono concettualmente diversi, ma possono utilizzare la stessa statistica e distribuzione di test. In un test di omogeneità, si presume che i totali marginali per una delle categorie facciano parte del progetto stesso: rappresentano il numero di soggetti selezionati per ciascun gruppo sperimentale. Ma poiché il test chi-quadrato ruota attorno al condizionamento su tutti i totali marginali, non ci sono conseguenze matematiche sulla distinzione tra test di omogeneità e test di indipendenza con dati categorici - almeno nessuno quando viene utilizzato questo test.
La mia domanda è la seguente: esiste qualche scuola di pensiero statistico o approccio statistico che potrebbe produrre analisi diverse, a seconda che stiamo testando l'indipendenza (dove tutti i marginali sono variabili casuali) o un test di omogeneità (dove un insieme di marginali è impostato dal design)?
Nel caso continuo, diciamo dove osserviamo sullo stesso soggetto e testiamo l'indipendenza, oppure osserviamo in popolazioni diverse e testiamo se provengono dalla stessa distribuzione, il metodo è diverso (correlazione analisi vs t-test). E se i dati categorici provenissero da variabili continue discretizzate? I test di indipendenza e omogeneità dovrebbero essere indistinguibili?( X 1 , X 2 )