Mi chiedo se esiste un test statistico per "testare" il significato di una distribuzione bimodale. Voglio dire, quanto i miei dati soddisfano o meno la distribuzione bimodale? In tal caso, c'è qualche test nel programma R?
Mi chiedo se esiste un test statistico per "testare" il significato di una distribuzione bimodale. Voglio dire, quanto i miei dati soddisfano o meno la distribuzione bimodale? In tal caso, c'è qualche test nel programma R?
Risposte:
Un altro possibile approccio a questo problema è quello di pensare a cosa potrebbe succedere dietro le quinte che sta generando i dati che vedi. Cioè, puoi pensare in termini di un modello di miscela , ad esempio un modello di miscela gaussiana. Ad esempio, potresti credere che i tuoi dati provengano da una singola popolazione normale o da una combinazione di due distribuzioni normali (in una certa proporzione), con mezzi e varianze diverse. Ovviamente, non devi credere che ce ne siano solo una o due, né devi credere che le popolazioni da cui vengono estratti i dati debbano essere normali.
Esistono (almeno) due pacchetti R che consentono di stimare i modelli di miscela. Un pacchetto è flexmix e un altro è mclust . Avendo stimato due modelli candidati, credo che potrebbe essere possibile condurre un test del rapporto di verosimiglianza. In alternativa, è possibile utilizzare il metodo parametrico crossstrap bootstrap ( pdf ).
Come menzionato nei commenti, la pagina di Wikipedia su "Distribuzione bimodale" elenca otto test per la multimodalità contro l'unimodalità e fornisce riferimenti per sette di essi.
Ce ne sono almeno alcuni in R. Ad esempio:
Il pacchetto diptest
implementa il test di immersione di Hartigan.
I stamp
dati nel bootstrap
pacchetto sono stati usati nell'Introduzione al Bootstrap di Efron e Tibshirani (il libro su cui si basa il pacchetto) per fare un esempio relativo al bootstrap sul numero di modalità; se hai accesso al libro potresti essere in grado di utilizzare questo approccio.
Efron, B. e Tibshirani, R. (1993) An Introduction to the Bootstrap .
Chapman and Hall, New York, Londra.
-
C'è una domanda sul CV che parla di identificare (cioè stimare piuttosto che testare) il numero di modi in cui si presenta la ricerca di @ whuber. Vale la pena leggere le risposte lì. Una delle risposte lì (la mia, come succede) ha un collegamento a una ricerca su Google che presenta questo articolo di David Donoho sulla costruzione di elementi di configurazione unilaterali per il numero di modalità, che ovviamente possono essere utilizzate come test (ad es. , se l'intervallo unilaterale non include il caso unimodale, puoi rifiutare l'unimodalità). Per quanto ne so, non lo èuno dei test che cita Wikipedia. Non penso che ci sia un'implementazione R di quell'intervallo, ma (nonostante il fatto che Donoho tenda ad usare strumenti abbastanza sofisticati nella sua discussione su di esso) è in realtà un'idea abbastanza semplice da implementare. Tale idea è direttamente correlata all'idea di utilizzare la stima della densità del kernel.