Sto incontrando qualche difficoltà a comprendere l'interpretazione del test KS a 2 campioni e come sia diverso da un test t regolare tra 2 gruppi.
Diciamo che ho maschi e femmine che svolgono un compito e raccolgo alcuni punteggi da quel compito. Il mio obiettivo finale è determinare se maschi e femmine svolgono in modo diverso quel compito
Quindi una cosa che potrei fare è eseguire il test tra i 2 gruppi. Un'altra cosa che potrei fare è calcolare l'ECDF per maschi e femmine, tracciarli e condurre il test KS a 2 campioni. Vorrei ottenere qualcosa del genere:
Test KS
L'ipotesi nulla per il test KS è che i 2 set di distribuzioni di punteggi continui provengano dalla stessa popolazione
Quando eseguo il test KS, ottengo: D = 0,18888, valore p = 0,04742
Innanzitutto, voglio verificare che la mia interpretazione dei risultati sia corretta. Qui, respingerei l'ipotesi nulla e direi che le distribuzioni di punteggi maschili e femminili provengono da popolazioni diverse. O in altre parole, la distribuzione dei punteggi maschili e femminili è diversa l'una dall'altra.
Più specificamente, i maschi tendono ad avere una maggiore probabilità di ottenere punteggi più bassi in questo compito, e questa è la differenza tra i 2 sessi mentre interpreto dalla trama
T-test
Ora al test testerà la differenza tra media maschile e femminile sulla variabile del punteggio.
Immaginiamo il caso in cui le prestazioni maschili sono peggiori delle femmine in questo compito. In tal caso, la distribuzione dei punteggi maschili sarà centrata su una media bassa, mentre la distribuzione dei punteggi femminili sarà centrata su una media alta. Questo scenario sarebbe in linea con la trama sopra, poiché i maschi avranno una maggiore probabilità di ottenere punteggi più bassi
Se il test t risulta essere significativo, vorrei concludere che il punteggio delle femmine, in media, è significativamente più alto rispetto ai maschi. O in termini di popolazione, i punteggi femminili sono tratti da una popolazione la cui media è superiore alla popolazione maschile, il che sembra molto simile alla conclusione KS secondo cui provengono da popolazioni diverse.
Qual è la differenza?
Quindi la conclusione che vorrei trarre in entrambi i casi di test KS e t è la stessa. I maschi si comportano male rispetto alle femmine. Quindi, qual è il vantaggio di utilizzare un test rispetto all'altro? Ci sono nuove conoscenze che puoi ottenere usando il test KS?
Per come la vedo io, i maschi con una distribuzione centrata su una media bassa e le femmine che centrano una media alta è ciò che causa il test t significativo. Ma per lo stesso fatto , i maschi avranno una maggiore probabilità di segnare valori più bassi, il che farebbe apparire la trama come sopra e dare un test KS significativo. Quindi i risultati di entrambi i test hanno la stessa causa sottostante, ma forse si potrebbe sostenere che un test KS prende in considerazione più del semplice mezzo delle distribuzioni e considera anche la forma della distribuzione, ma è possibile analizzare la causa del significativo test KS solo dai risultati del test?
Quindi qual è il valore nell'esecuzione di un test KS al test? E supponiamo che io possa soddisfare i presupposti del test t per questa domanda