Dopo un recente voto negativo ho cercato di verificare la mia comprensione del test Pearson Chi Squared. Di solito uso la statistica chi quadrato (o statistica chi quadrato ridotta) per adattarsi o controllare l'adattamento risultante. In questo caso, la varianza di solito non è il numero atteso di conteggi in una tabella o istogramma ma una varianza determinata sperimentalmente. Ad ogni modo, ho sempre avuto l'impressione che il test usasse ancora la normalità asintotica del PDF multinomiale (ovvero la mia statistica test è
e è multinormale asintoticamente dove V è la matrice di covarianza). Pertanto Q ha una distribuzione chi-quadrata data n grande quindi usando il numero atteso di conteggi come il denominatore nella statistica diventa valido per n grande . È possibile che ciò sia vero solo per gli istogrammi, non ho analizzato una piccola tabella di dati da anni.
C'è un argomento più sottile che mi manca? Sarei interessato a un riferimento, o ancora meglio a una breve spiegazione. (Anche se è possibile, ho appena votato perché ho omesso la parola asintotica, che concedo è piuttosto importante.)