Quali sono le tecniche statistiche per creare un set di campioni, che è rappresentativo dell'intera popolazione (con un livello di confidenza noto)?
Anche,
- Come convalidare, se il campione si adatta all'insieme di dati complessivo?
- È possibile, senza analizzare l'intero set di dati (che potrebbe essere miliardi di record)?