Sto cercando di separare due gruppi di valori da un singolo set di dati. Posso presumere che una delle popolazioni sia normalmente distribuita e abbia almeno la metà della dimensione del campione. I valori del secondo sono entrambi inferiori o superiori ai valori del primo (la distribuzione è sconosciuta). Quello che sto cercando di fare è trovare i limiti superiore e inferiore che racchiudono la popolazione normalmente distribuita dall'altra.
La mia ipotesi mi fornisce il punto di partenza:
- tutti i punti all'interno dell'intervallo interquartile del campione provengono dalla popolazione normalmente distribuita.
Sto cercando di testare gli outlier che li prendono dal resto del campione fino a quando non rientrano nel terzo livello della popolazione normalmente distribuita. Che non è l'ideale, ma sembra produrre risultati abbastanza ragionevoli.
Il mio presupposto è statisticamente valido? Quale sarebbe un modo migliore per farlo?
ps per favore correggi i tag qualcuno.