Test per la distribuzione bimodale


30

Mi chiedo se esiste un test statistico per "testare" il significato di una distribuzione bimodale. Voglio dire, quanto i miei dati soddisfano o meno la distribuzione bimodale? In tal caso, c'è qualche test nel programma R?


3
Non hai trovato una risposta cercando nel nostro sito ? In caso contrario, cosa manca?
whuber

7
Esistono test per bimodalità o multimodalità, ma tendono ad essere unilaterali. Cioè, puoi concludere cose come "c'è più di una modalità", ma non puoi dire "ci sono meno di tre modalità": puoi ottenere limiti inferiori sul numero di modalità ma non puoi davvero ottenere limiti superiori perché è possibile trovare una distribuzione multimodale con un numero qualsiasi di modalità che è arbitrariamente vicino a una distribuzione con un numero minore di modalità. Vedrò se riesco a trovare alcuni test o riferimenti espliciti.
Glen_b -Restate Monica

4
La pagina di Wikipedia sulla distribuzione bimodale elenca otto test per la multimodalità contro l'unimodalità e fornisce riferimenti per sette di essi. Non sono sicuro se ci sono in R. Cercherò.
Glen_b -Restate Monica

Risposte:


17

Un altro possibile approccio a questo problema è quello di pensare a cosa potrebbe succedere dietro le quinte che sta generando i dati che vedi. Cioè, puoi pensare in termini di un modello di miscela , ad esempio un modello di miscela gaussiana. Ad esempio, potresti credere che i tuoi dati provengano da una singola popolazione normale o da una combinazione di due distribuzioni normali (in una certa proporzione), con mezzi e varianze diverse. Ovviamente, non devi credere che ce ne siano solo una o due, né devi credere che le popolazioni da cui vengono estratti i dati debbano essere normali.

Esistono (almeno) due pacchetti R che consentono di stimare i modelli di miscela. Un pacchetto è flexmix e un altro è mclust . Avendo stimato due modelli candidati, credo che potrebbe essere possibile condurre un test del rapporto di verosimiglianza. In alternativa, è possibile utilizzare il metodo parametrico crossstrap bootstrap ( pdf ).


Ciao @gung, per il metodo parametrico del crossstrap bootstrap, come definiresti il ​​criterio ottimale rispetto alla distribuzione bimodale? Potrebbe esserci un caso in cui due distribuzioni concorrenti si incrociano in due punti. Cosa si dovrebbe fare in questo caso?
Akashrajkn,

32

Come menzionato nei commenti, la pagina di Wikipedia su "Distribuzione bimodale" elenca otto test per la multimodalità contro l'unimodalità e fornisce riferimenti per sette di essi.

Ce ne sono almeno alcuni in R. Ad esempio:

  1. Il pacchetto diptestimplementa il test di immersione di Hartigan.

  2. I stampdati nel bootstrappacchetto sono stati usati nell'Introduzione al Bootstrap di Efron e Tibshirani (il libro su cui si basa il pacchetto) per fare un esempio relativo al bootstrap sul numero di modalità; se hai accesso al libro potresti essere in grado di utilizzare questo approccio.

    Efron, B. e Tibshirani, R. (1993) An Introduction to the Bootstrap .
    Chapman and Hall, New York, Londra.

-

C'è una domanda sul CV che parla di identificare (cioè stimare piuttosto che testare) il numero di modi in cui si presenta la ricerca di @ whuber. Vale la pena leggere le risposte lì. Una delle risposte lì (la mia, come succede) ha un collegamento a una ricerca su Google che presenta questo articolo di David Donoho sulla costruzione di elementi di configurazione unilaterali per il numero di modalità, che ovviamente possono essere utilizzate come test (ad es. , se l'intervallo unilaterale non include il caso unimodale, puoi rifiutare l'unimodalità). Per quanto ne so, non lo èuno dei test che cita Wikipedia. Non penso che ci sia un'implementazione R di quell'intervallo, ma (nonostante il fatto che Donoho tenda ad usare strumenti abbastanza sofisticati nella sua discussione su di esso) è in realtà un'idea abbastanza semplice da implementare. Tale idea è direttamente correlata all'idea di utilizzare la stima della densità del kernel.


È un lavoro prezioso.
rolando2,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.