Il modello statistico standard alla base dell'analisi delle tabelle di contingenza è quello di supporre che (incondizionatamente sul conteggio totale) i conteggi delle celle siano variabili casuali indipendenti di Poisson. Pertanto, se si dispone di una tabella di contingenza n×m , il modello statistico utilizzato come base per l'analisi richiede che ogni conteggio delle celle abbia una distribuzione incondizionata:
Xi,j ~ Pois(μi,j)
Dopo aver imposto un conteggio totale di celle per la tabella di contingenza o un conteggio di righe o colonne, le distribuzioni condizionali risultanti dei conteggi di celle diventano multinomiali. In ogni caso, per una distribuzione di Poisson abbiamo E(Xi,j)=V(Xi,j)=μi,j , quindi il conteggio delle cellule standardizzato è:
STD(Xi,j)≡Xi,j−E(Xi,j)V(Xi,j)−−−−−−√=Xi,j−μi,jμi,j−−−√
Quindi, quello che stai vedendo nella formula di cui ti stai chiedendo, è il conteggio cellulare standardizzato, supponendo che i conteggi cellulari abbiano una distribuzione (incondizionata) di Poisson.
Da qui è comune testare l'indipendenza della variabile di riga e colonna nei dati e in questo caso è possibile utilizzare una statistica di test che esamina la somma dei quadrati dei valori sopra (che equivale alla norma quadrata del vettore di valori standardizzati). Il test chi-quadrato fornisce un valore p per questo tipo di test basato su un'approssimazione di grandi campioni alla distribuzione nulla della statistica del test. Di solito viene applicato nei casi in cui nessuno dei conteggi di vendita è troppo piccolo.
stdres
per i residui standardizzati.