La suddivisione del campione potrebbe forse ridurre il problema con la distribuzione della statistica, ma non lo rimuove.
La tua idea evita il problema che le stime saranno "troppo vicine" rispetto ai valori della popolazione perché si basano sullo stesso campione.
Non stai evitando il problema che sono ancora stime. La distribuzione della statistica del test non è quella tabulata.
In questo caso aumenta il tasso di rifiuto sotto il valore null, invece di ridurlo notevolmente.
Una scelta migliore consiste nell'utilizzare un test in cui non si presume che i parametri siano noti, come uno Shapiro Wilk.
Se sei sposato con un tipo di test di Kolmogorov-Smirnov, puoi seguire l'approccio del test di Lilliefors.
Cioè, per usare la statistica KS ma avere la distribuzione della statistica del test riflettere l'effetto della stima dei parametri - simulare la distribuzione della statistica del test sotto la stima dei parametri. (Non è più privo di distribuzione, quindi sono necessarie nuove tabelle per ogni distribuzione.)
http://en.wikipedia.org/wiki/Lilliefors_test
Liliefors ha usato la simulazione per il caso normale ed esponenziale, ma puoi farlo facilmente per qualsiasi distribuzione specifica; in qualcosa come R è una questione di momenti per simulare 10.000 o 100.000 campioni e ottenere una distribuzione della statistica di test sotto il valore null.
[Un'alternativa potrebbe essere quella di considerare l'Anderson-Darling, che ha lo stesso problema, ma che - a giudicare dal libro di D'Agostino e Stephens ( tecniche di bontà di adattamento ) sembra essere meno sensibile ad esso. Potresti adattare l'idea di Lilliefors, ma suggeriscono una regolazione relativamente semplice che sembra funzionare abbastanza bene.]
Ma ci sono ancora altri approcci; ci sono famiglie di test regolari di bontà di adattamento, ad esempio (ad esempio vedere il libro di Rayner e Best) che in un certo numero di casi specifici possono gestire la stima dei parametri.
* l'effetto può essere ancora piuttosto grande - forse più grande di quanto normalmente sarebbe considerato accettabile; Momo ha ragione a esprimere preoccupazione al riguardo. Se un tasso di errore di tipo I superiore (e una curva di potenza più piatta) è un problema, questo potrebbe non essere un miglioramento!