Sto lavorando alla creazione di un sito Web, che mostra i dati del censimento per un utente selezionato Poligoni e vorrei mostrare graficamente la distribuzione di vari parametri (un grafico per parametro).
I dati di solito hanno le seguenti proprietà:
- Le dimensioni del campione tendono ad essere grandi (diciamo circa 10.000 punti dati)
- L'intervallo di valori tende ad essere molto ampio (ad esempio, la popolazione minima può essere inferiore a 100 e il massimo può essere qualcosa come 500.000)
- q1 di solito è vicino al minimo (diciamo 200) mentre q2 e q3 saranno entro 10.000
- Non assomiglia a una normale distribuzione
Non sono uno statistico e quindi la mia descrizione potrebbe non essere esattamente chiara.
Vorrei mostrare questa distribuzione su un grafico, che sarà visto dai cittadini (il profano, se vuoi).
Avrei preferito usare un istogramma, ma non è possibile a causa dell'ampia gamma di valori, a causa della quale fare bin non è davvero facile e diretto.
Da quel poco che so delle statistiche, un diagramma a scatole è ciò che viene spesso usato per mostrare questo tipo di dati, ma sento che per un laico decifrare la trama di Box non è facile.
Quali sono le mie opzioni per mostrare questi dati in modo facile da capire?