La varianza è il secondo momento meno il quadrato del primo momento, quindi è sufficiente calcolare i momenti delle miscele.
In generale, date le distribuzioni con PDF e pesi costanti (non casuali) p i , il PDF della miscela èfipi
f(x)=∑ipifi(x),
da cui segue immediatamente per qualsiasi momento quellok
μ( k )= Ef[ xK] = ∑iopioEfio[ xK] = ∑iopioμ( k )io.
Ho scritto per il momento k t h di f e μ ( k ) i per il momento k t h di f i .μ(k)kthfμ(k)ikthfi
Usando queste formule, la varianza può essere scritta
Var(f)=μ(2)−(μ(1))2=∑ipiμ(2)i−(∑ipiμ(1)i)2.
Equivalentemente, se le varianze di sono date come σ 2 i , allora μ ( 2 ) i = σ 2 i + ( μ ( 1 ) i ) 2 , consentendo alla varianza della miscela f di essere scritta in termini di varianze e mezzi dei suoi componenti comefiσ2iμ(2)i=σ2i+(μ(1)i)2f
Var(f)=∑ipi(σ2i+(μ(1)i)2)−(∑ipiμ(1)i)2=∑ipiσ2i+∑ipi(μ(1)i)2−(∑ipiμ(1)i)2.
In parole, questa è la varianza media (ponderata) più la media quadrata media meno il quadrato della media media. Poiché la quadratura è una funzione convessa, la disuguaglianza di Jensen afferma che la media quadrata media non può essere inferiore al quadrato della media media. Questo ci consente di comprendere la formula in quanto affermando che la varianza della miscela è la miscela delle varianze più un termine non negativo che tiene conto della dispersione (ponderata) dei mezzi.
Nel tuo caso la varianza è
pAσ2A+pBσ2B+[pAμ2A+pBμ2B−(pAμA+pBμB)2].
Possiamo interpretare che questa è una miscela ponderata delle due varianze, , più un termine di correzione (necessariamente positivo) per tenere conto degli spostamenti dai singoli mezzi rispetto alla media complessiva della miscela.pAσ2A+pBσ2B
L'utilità di questa varianza nell'interpretazione dei dati, come quella fornita nella domanda, è dubbia, perché la distribuzione della miscela non sarà normale (e potrebbe discostarsi sostanzialmente da essa, nella misura in cui esibisce la bimodalità).