La varianza ponderata senza paragoni era già stata affrontata qui e altrove, ma sembra esserci ancora una sorprendente quantità di confusione. Sembra esserci un consenso sulla formula presentata nel primo link e nell'articolo di Wikipedia . Questa sembra anche la formula usata da R, Mathematica e GSL (ma non MATLAB). Tuttavia, l'articolo di Wikipedia contiene anche la seguente riga che sembra un ottimo controllo di integrità per un'implementazione della varianza ponderata:
Ad esempio, se i valori {2,2,4,5,5,5} sono tratti dalla stessa distribuzione, allora possiamo considerare questo set come un campione non ponderato o possiamo trattarlo come un campione ponderato {2,4, 5} con pesi corrispondenti {2,1,3} e dovremmo ottenere gli stessi risultati.
I miei calcoli danno il valore di 2.1667 per la varianza dei valori originali e 2.9545 per la varianza ponderata. Dovrei davvero aspettarmi che siano uguali? Perché o perché no?