Ci sono differenze nelle ipotesi e nelle ipotesi che sono state testate.
L'ANOVA (e il test t) è esplicitamente un test di uguaglianza di mezzi di valori. Il Kruskal-Wallis (e Mann-Whitney) può essere visto tecnicamente come un confronto dei ranghi medi .
Quindi, in termini di valori originali, il Kruskal-Wallis è più generale di un confronto di mezzi: verifica se la probabilità che un'osservazione casuale da ciascun gruppo sia ugualmente sopra o sotto un'osservazione casuale da un altro gruppo. La vera quantità di dati che sta alla base di tale confronto non è né la differenza nelle medie né la differenza nelle mediane (nel caso dei due campioni) è in realtà la mediana di tutte le differenze a coppie - la differenza tra Hodges-Lehmann tra campioni.
Tuttavia, se si sceglie di fare alcune ipotesi restrittive, allora Kruskal-Wallis può essere visto come un test di uguaglianza dei mezzi della popolazione, così come i quantili (ad esempio le mediane), e in effetti un'ampia varietà di altre misure. Cioè, se si assume che le distribuzioni di gruppo sotto l'ipotesi nulla siano le stesse e che in alternativa, l'unico cambiamento sia uno spostamento distributivo (una cosiddetta " alternativa allo spostamento di posizione "), allora è anche un test di uguaglianza dei mezzi della popolazione (e, contemporaneamente, di mediane, quartili inferiori, ecc.).
[Se lo fai, puoi ottenere stime e intervalli per i relativi turni, proprio come puoi fare con ANOVA. Bene, è anche possibile ottenere intervalli senza tale presupposto, ma sono più difficili da interpretare.]
Se guardi la risposta qui , specialmente verso la fine, discute il confronto tra il test t e il Wilcoxon-Mann-Whitney, che (quando si eseguono almeno test a due code) sono l'equivalente di ANOVA e Kruskal-Wallis applicato a un confronto di soli due campioni; fornisce un po 'più di dettaglio, e gran parte di quella discussione passa al Kruskal-Wallis contro l'ANOVA.
Non è del tutto chiaro cosa intendi per differenza pratica. Li usi in generale in modo simile. Quando si applicano entrambe le serie di ipotesi, di solito tendono a fornire risultati abbastanza simili, ma in alcune situazioni possono certamente fornire valori p abbastanza diversi.
Modifica: ecco un esempio della somiglianza di inferenza anche a piccoli campioni - ecco la regione di accettazione congiunta per i cambiamenti di posizione tra tre gruppi (il secondo e il terzo ciascuno rispetto al primo) campionati da distribuzioni normali (con campioni di piccole dimensioni) per un determinato set di dati, a livello del 5%:
Numerose caratteristiche interessanti possono essere individuate: in questo caso la regione di accettazione leggermente più grande per il KW, con il suo confine costituito da segmenti di linea retta verticali, orizzontali e diagonali (non è difficile capire perché). Le due regioni ci dicono cose molto simili sui parametri di interesse qui.