Usa le definizioni di media
μ1:n=1n∑i=1nxi
e varianza del campione
σ21:n=1n∑i=1n(xi−μ1:n)2=n−1n(1n−1∑i=1n(xi−μ1:n)2)
(l'ultimo termine tra parentesi è lo stimatore di varianza imparziale spesso calcolato di default nel software statistico) per trovare la somma dei quadrati di tutti i dati . Ordiniamo gli indici modo che designi gli elementi del primo gruppo e designi gli elementi del secondo gruppo. Spezza quella somma di quadrati per gruppo e riesprimi i due pezzi in termini di varianze e mezzi dei sottoinsiemi dei dati: i i = 1 , … , n i = n + 1 , … , n + mxiii=1,…,ni=n+1,…,n+m
(m+n)(σ21:m+n+μ21:m+n)=∑i=11:n+mx2i=∑i=1nx2i+∑i=n+1n+mx2i=n(σ21:n+μ21:n)+m(σ21+n:m+n+μ21+n:m+n).
Algebricamente risolvendolo per in termini di altri rendimenti di quantità (conosciuti)σ2m+n
σ21:m+n=n(σ21:n+μ21:n)+m(σ21+n:m+n+μ21+n:m+n)m+n−μ21:m+n.
Naturalmente, utilizzando lo stesso approccio, può essere espresso in termini di gruppo significa anche.μ1:m+n=(nμ1:n+mμ1+n:m+n)/(m+n)
Un collaboratore anonimo sottolinea che quando le medie del campione sono uguali (in modo che ), la soluzione per è una media ponderata delle varianze del campione di gruppo.μ1:n=μ1+n:m+n=μ1:m+nσ2m+n