Quali sono i metodi migliori per adattare la 'modalità' di dati campionati da una distribuzione continua?
Dato che la modalità è tecnicamente indefinita (giusto?) Per una distribuzione continua, sto davvero chiedendo "come trovi il valore più comune"?
Se si presume che la distribuzione padre sia gaussiana, è possibile eseguire il bin dei dati e scoprire che la modalità è la posizione del bin con il maggior numero di conteggi. Tuttavia, come si determina la dimensione del cestino? Sono disponibili implementazioni solide? (vale a dire, robusto per i valori anomali). Uso python
/ scipy
/ numpy
, ma probabilmente posso tradurre R
senza troppe difficoltà.