Eliminerò tutti i dettagli e gli esperimenti biologici e citerò solo il problema attuale e quello che ho fatto statisticamente. Vorrei sapere se è giusto e, in caso contrario, come procedere. Se i dati (o la mia spiegazione) non sono abbastanza chiari, proverò a spiegare meglio modificando.
Supponiamo che io abbia due gruppi / osservazioni, X e Y, con dimensione e . Vorrei sapere se i mezzi di queste due osservazioni sono uguali. La mia prima domanda è:
Se le ipotesi sono soddisfatte, è rilevante utilizzare qui un test t parametrico a due campioni? Lo chiedo perché dalla mia comprensione di solito si applica quando la dimensione è piccola?
Ho tracciato istogrammi di X e Y e non erano normalmente distribuiti, uno dei presupposti di un test t a due campioni. La mia confusione è che li considero due popolazioni ed è per questo che ho verificato la normale distribuzione. Ma poi sto per eseguire un test t a due CAMPIONI ... È giusto?
Dal teorema del limite centrale, capisco che se si esegue il campionamento (con / senza ripetizione a seconda della dimensione della popolazione) più volte e si calcola la media dei campioni ogni volta, allora sarà distribuito approssimativamente normalmente. E la media di queste variabili casuali sarà una buona stima della media della popolazione. Quindi, ho deciso di farlo su X e Y, 1000 volte, e ho ottenuto campioni e ho assegnato una variabile casuale alla media di ciascun campione. La trama era normalmente distribuita. La media di X e Y era 4.2 e 15.8 (che erano uguali alla popolazione + - 0,15) e la varianza era 0,95 e 12,11.
Ho eseguito un test t su queste due osservazioni (1000 punti dati ciascuno) con varianze disuguali, perché sono molto diverse (0,95 e 12,11). E l'ipotesi nulla è stata respinta.
Ha senso per niente? Questo approccio corretto / significativo o uno z-test a due campioni è sufficiente o è totalmente sbagliato?Ho anche eseguito un test Wilcoxon non parametrico solo per essere sicuro (su X e Y originali) e l'ipotesi nulla è stata respinta in modo convincente anche lì. Nel caso in cui il mio metodo precedente fosse completamente sbagliato, suppongo che fare un test non parametrico sia buono, tranne forse per il potere statistico?
In entrambi i casi, i mezzi erano significativamente diversi. Tuttavia, vorrei sapere se uno o entrambi gli approcci sono errati / totalmente errati e, in tal caso, qual è l'alternativa?