Immagina di ripetere tre volte un esperimento. In ogni esperimento, raccogli misurazioni triplicate. I triplicati tendono ad essere abbastanza vicini tra loro, rispetto alle differenze tra i tre mezzi sperimentali. Calcolare la media è piuttosto semplice. Ma come si può calcolare un intervallo di confidenza per il grande significato?
Dati di esempio:
Esperimento 1: 34, 41, 39
Esperimento 2: 45, 51, 52
Esperimento 3: 29, 31, 35
Supponiamo che i valori replicati all'interno di un esperimento seguano una distribuzione gaussiana, così come i valori medi di ciascun esperimento. La SD di variazione all'interno di un esperimento è più piccola della SD tra i mezzi sperimentali. Supponiamo anche che non vi sia alcun ordinamento dei tre valori in ciascun esperimento. L'ordine da sinistra a destra dei tre valori in ciascuna riga è del tutto arbitrario.
L'approccio semplice consiste nel calcolare prima la media di ciascun esperimento: 38.0, 49.3 e 31.7, quindi calcolare la media e il suo intervallo di confidenza al 95% di questi tre valori. Usando questo metodo, la media grande è 39.7 con l'intervallo di confidenza del 95% che va da 17,4 a 61,9.
Il problema con questo approccio è che ignora totalmente la variazione tra i triplicati. Mi chiedo se non ci sia un buon modo per giustificare quella variazione.