Ho riferimenti che mi hanno consigliato di prendere in considerazione una dimensione del campione di almeno 20 per la distribuzione dei dati.
C'è senso in questo?
Grazie
Ho riferimenti che mi hanno consigliato di prendere in considerazione una dimensione del campione di almeno 20 per la distribuzione dei dati.
C'è senso in questo?
Grazie
Risposte:
Gran parte di ciò dipende dalla distribuzione prevista e dalla domanda di ricerca. Come regola empirica, dovresti stare attento alle regole empiriche. Se si conosce la distribuzione prevista, eseguire alcune simulazioni di dimensioni diverse e determinare la frequenza con cui le simulazioni del campione riflettono la distribuzione effettiva. Ciò dovrebbe fornire alcune indicazioni sulla dimensione del campione finale richiesta.
No. Non da remoto.
Pensaci in questo modo: se avessi uno spazio miliardario (umanità) e tirassi fuori 20 campioni usando qualunque metodo (20 persone) potresti usare le informazioni ottenute per capire ragionevolmente bene ogni persona sul pianeta? Non da remoto. Ci sono 100 miliardi di stelle nella galassia della Via Lattea. Scegliendone (casualmente) 20 puoi capire tutta l'astronomia galattica? Non c'è modo.
In uno spazio 1-d ci sono alcune euristiche, per lo più valide regole empiriche che possono aiutare, che descrivono quante misure vuoi prendere. Includono vari gradi di utilità e giustificazione, ma sono in qualche modo più ben difesi di "20". Includono "5 misurazioni per variabile nell'equazione di adattamento", "almeno 35 campioni di una funzione di densità gaussiana" e "almeno 300 campioni di una funzione binomiale". I veri statistici e non un secchione come me saranno in grado di associare particolari intervalli di confidenza e incertezze dai primi principi e senza una calcolatrice.
Ricorda che "migliore" è un'idea insignificante senza avere una "misura di bontà". Qual è il percorso migliore? Se stai andando al tuo destino, forse estremamente lungo e piacevole. Se stai andando alla tua incoronazione, forse breve e magnifica. Se stai camminando attraverso il deserto, una bella ombra. Qual è il numero "migliore" di campioni? È così straordinariamente dipendente dal tuo problema che non si può iniziare a rispondere con autorità prima. Tutti loro? Quante ne puoi? Hanno solo un piccolo senso. Sì, è come essere parzialmente morto o incinta. Essere parzialmente insensati è una conseguenza di un problema molto poco definito.
Se stai cercando di prevedere con precisione il flusso d'aria su un aereo? Potresti aver bisogno di diversi milioni di misurazioni per entrare nel parco delle palle. Se vuoi sapere quanto sei alto, uno o due potrebbero fare il lavoro.
Ciò non fa emergere i punti importanti di "estensione dello spazio" e "campionamento in posizioni che minimizzano la varianza nelle stime dei parametri", ma la domanda suggeriva che una risposta più a livello di matricola sarebbe pertinente. Queste cose richiedono di conoscere meglio la natura del problema prima di poter essere implementate.
Nota: modificato per migliorare per suggerimenti.
Forse per il contesto in cui stai eseguendo i test t o ANOVAR - un contesto abbastanza comune nelle applicazioni statistiche di base - è circa la dimensione del campione di cui hai bisogno per ciascun gruppo al fine di essere in grado di avere molta fiducia nel fatto che la media di ciascun gruppo è approssimativamente normalmente distribuito (secondo il teorema del limite centrale) quando si può presumere che la distribuzione sia più o meno unimodale e non estremamente alta. Venti e non diciannove o ventuno perché è un numero tondo.
Controlla la potenza di Russ Lenth e la pagina delle dimensioni del campione per alcuni articoli sull'argomento (nella sezione Consigli al centro della pagina).
Il numero minimo di individui nel campione varia notevolmente in base alla dimensione della popolazione, al numero di dimensioni (se si dividono i dati in categorie) e alle misure (se si adottano misure continue sugli individui del campione) che si stanno assumendo, le dimensioni di il tuo universo, la tecnica di analisi che intendi utilizzare (questo è un punto molto importante: la tecnica è definita durante la pianificazione dello studio o durante la progettazione sperimentale , mai dopo) e la complessità dimostrata da studi precedenti.
E 20 non è abbastanza per qualsiasi ricerca seria al di fuori dei temi delle "malattie rare" e della "psicologia sperimentale" (la psicologia definita da Popper nel suo lavoro).
E 20 non è sufficiente per qualsiasi ricerca seria al di fuori dei temi delle "malattie rare" e della "psicologia sperimentale" (la psicologia definita da Popper nel suo lavoro) che implica l'adattamento di una distribuzione di probabilità .
E no, non dovresti continuare ad avvelenare le persone per ottenere campioni di grandi dimensioni. I test di senso comune e sequenziali ti ordinano di interrompere.