È corretto utilizzare il test di bontà di adattamento di Kolmogorov-Smirnov per confrontare due distribuzioni empiriche per determinare se sembrano provenire dalla stessa distribuzione sottostante, piuttosto che confrontare una distribuzione empirica con una distribuzione di riferimento predefinita?
Lasciami provare a chiederlo in un altro modo. Raccolgo N campioni da una certa distribuzione in una posizione. Raccolgo M campioni in un'altra posizione. I dati sono continui (ogni campione è un numero reale tra 0 e 10, diciamo) ma normalmente non distribuito. Voglio verificare se questi campioni N + M provengono tutti dalla stessa distribuzione sottostante. È ragionevole utilizzare il test Kolmogorov-Smirnov per questo scopo?
In particolare, ho potuto calcolare la distribuzione empirica dai campioni N e la distribuzione empirica F 1 dai campioni M. Quindi, potrei calcolare la statistica del test di Kolmogorov-Smirnov per misurare la distanza tra F 0 e F 1 : vale a dire, calcolare D = sup x | F 0 ( x ) - F 1 ( x ) | e usa Dcome la mia statistica di prova come nel test di Kolmogorov-Smirnov per la bontà di adattamento. È un approccio ragionevole?
(Ho letto altrove che il test di Kolmogorov-Smirnov per la bontà di adattamento non è valido per distribuzioni discrete , ma ammetto di non capire cosa significhi o perché potrebbe essere vero. Significa che il mio approccio proposto è negativo? )
Oppure, mi consiglia qualcos'altro invece?