Supponiamo di avere un set di dati da una distribuzione continua con densità supportata su che non è noto, ma è piuttosto grande, quindi una densità del kernel (ad esempio) la stima, , è piuttosto accurata. Per una particolare applicazione ho bisogno di trasformare i dati osservati in un numero finito di categorie per produrre un nuovo set di dati con una funzione di massa implicita .p ( y ) Z 1 , . . . , Z n g ( z )
Un semplice esempio potrebbe essere quando e quando . In questo caso la funzione di massa indotta sarebbe
I due "parametri di ottimizzazione" qui sono il numero di gruppi, , e il vettore di lunghezza delle soglie . Indica la funzione di massa indotta da .g m , λ ( y )
Vorrei una procedura che rispondesse, ad esempio, "Qual è la scelta migliore di modo che l'aumento del numero di gruppi a (e la scelta del ottimale lì) produrrebbe un miglioramento trascurabile?" . Sento che forse è possibile creare una statistica di prova (forse con la differenza nella divergenza di KL o qualcosa di simile) la cui distribuzione può essere derivata. Qualche idea o letteratura pertinente?
Modifica: ho spaziato uniformemente le misurazioni temporali di una variabile continua e sto usando una catena di Markov inomogenea per modellare la dipendenza temporale. Francamente, le catene di markov statali discrete sono molto più facili da gestire e questa è la mia motivazione. I dati osservati sono percentuali. Attualmente sto usando una discretizzazione ad hoc che mi sembra molto buona, ma penso che questo sia un problema interessante in cui è possibile una soluzione formale (e generale).
Modifica 2: minimizzare effettivamente la divergenza di KL equivarrebbe a non discretizzare i dati, quindi l'idea è totalmente fuori. Ho modificato il corpo di conseguenza.