Risposte:
Come sottolineato da Stijn, il test ks restituisce una statistica D e un valore p corrispondenti alla statistica D. La statistica D è la distanza massima assoluta (supremum) tra i CDF dei due campioni. Più questo numero è vicino a 0, più è probabile che i due campioni siano stati estratti dalla stessa distribuzione. Dai un'occhiata alla pagina di Wikipedia per il test ks. Fornisce una buona spiegazione: https://en.m.wikipedia.org/wiki/Kolmogorov%E2%80%93Smirnov_test
Il valore p restituito dal test ks ha la stessa interpretazione di altri valori p. Rifiuti l'ipotesi nulla che i due campioni siano stati estratti dalla stessa distribuzione se il valore p è inferiore al tuo livello di significatività. Puoi trovare tabelle online per la conversione della statistica D in un valore p se sei interessato alla procedura.
Quando esegui una ricerca su Google per ks_2samp, il primo successo è questo sito web. Su di esso, puoi vedere la specifica della funzione:
This is a two-sided test for the null hypothesis that 2 independent samples are drawn from the same continuous distribution.
Parameters :
a, b : sequence of 1-D ndarrays
two arrays of sample observations assumed to be drawn from a continuous distribution, sample sizes can be different
Returns :
D : float, KS statistic
p-value : float, two-tailed p-value