Ho difficoltà a selezionare il modo giusto di visualizzare i dati. Diciamo che abbiamo librerie che vendono libri e ogni libro ha almeno una categoria .
Per una libreria, se contiamo tutte le categorie di libri, acquisiamo un istogramma che mostra il numero di libri che rientrano in una categoria specifica per quella libreria.
Voglio visualizzare il comportamento della libreria, voglio vedere se favoriscono una categoria rispetto ad altre categorie. Non voglio vedere se stanno favorendo la fantascienza tutti insieme, ma voglio vedere se stanno trattando ogni categoria allo stesso modo o no.
Ho ~ 1 milione di librerie.
Ho pensato a 4 metodi:
Campiona i dati, mostra solo 500 istogrammi della libreria. Mostrali in 5 pagine separate usando la griglia 10x10. Esempio di una griglia 4x4:
Come il numero 1. Ma questa volta ordina i valori dell'asse x in base alla loro descrizione del conteggio, quindi se c'è un favorito sarà facilmente visibile.
Immagina di mettere gli istogrammi nel n. 2 insieme come un mazzo e mostrarli in 3D. Qualcosa come questo:
Invece di usare il colore di causa del terzo asse per rappresentare i colori, quindi usando una mappa di calore (istogramma 2D):
se generalmente le librerie preferiscono alcune categorie ad altre, verranno visualizzate come gradiente da sinistra a destra.
Hai altre idee / strumenti di visualizzazione per rappresentare più istogrammi?