Sono d'accordo che la trama "migliore" non esiste indipendentemente dal set di dati, dai lettori e dallo scopo. Per due variabili misurate, i grafici a dispersione sono probabilmente il progetto che lascia tutti gli altri sulla sua scia, tranne per scopi specifici, ma nessun dato di mercato è evidente per i dati categorici.
Il mio obiettivo qui è solo quello di menzionare un metodo semplice, spesso riscoperto o reinventato, ma tuttavia spesso trascurato anche in monografie o libri di testo che trattano grafici statistici.
Esempio prima, che copre gli stessi dati pubblicati da xan:
Se si desidera un nome, come spesso accade , si tratta di un grafico a barre doppio (in questo caso). Non catalogherò altri termini qui, tranne per il fatto che più grafici a barre sono un'alternativa comune con un sapore simile. (La mia piccola obiezione al "grafico a barre multiple" è che "multiplo" non esclude i grafici a barre sovrapposti o affiancati molto comuni, mentre "twoway" per me implica più chiaramente un layout di riga e colonna, anche se a sua volta potrebbe fare degli esempi per chiarirlo.)
Vantaggi e svantaggi per questo tipo di trama sono anche semplici, ma ne spiegherò alcuni. Dato che adoro questo design (che risale almeno agli anni '30), altri potrebbero voler aggiungere critiche più acute.
+1. L'idea è facilmente comprensibile , anche da gruppi non tecnici. Le altezze delle barre o le lunghezze delle barre codificano le frequenze in questo esempio. In altri esempi, potrebbero codificare le percentuali calcolate in qualsiasi modo, residui, ecc.
+2. La struttura di riga e colonna corrisponde a quella di una tabella . Puoi anche aggiungere valori numerici. Quantità molto piccole e persino zeri impliciti sono chiaramente evidenti, il che non è sempre il caso di altri progetti (ad esempio grafici a barre sovrapposte, grafici a mosaico). L'etichettatura di righe e colonne è in genere più efficiente dell'aggiunta di una chiave o legenda, con il "avanti e indietro" mentale che richiede. Quindi questo design ibrida le idee di grafici e tabelle, il che sembra preoccupare alcuni lettori; al contrario, direi che le forti distinzioni tra figure e tabelle sono solo momenti storici, obsoleti ora che i ricercatori possono preparare i propri documenti e non devono fare affidamento su designer, compositori e tipografi.
+3. In linea di principio, le estensioni a progetti a tre o più livelli sono facili . Inserisci due o più variabili come variabili composte su uno o entrambi gli assi o dai un array di tali grafici. Naturalmente, più complicato è il design, più complicata è l'interpretazione.
+4. Il design consente chiaramente variabili ordinali su entrambi gli assi. L'ordine può essere espresso (ad es.) Mediante un'ombreggiatura appropriata, nonché l'ordine delle categorie su quell'asse. L'ordine delle categorie sugli assi può essere determinato dal loro significato, o meglio determinato dalle frequenze; L'ordine alfabetico in base alle etichette di testo può essere un valore predefinito, ma non dovrebbe mai essere l'unica scelta considerata.
-1. Essendo generale nella progettazione, la trama può essere meno efficiente nel mostrare determinati tipi di relazioni . In particolare, una trama a mosaico può rendere molto chiare le partenze dall'indipendenza. Al contrario, quando le relazioni tra variabili categoriche sono complicate o poco chiare, in genere nessun grafico è in grado di mostrare più di quel fatto debole.
-2. In un certo senso, il design è inefficiente nell'uso dello spazio lasciando spazio a ogni combinazione incrociata, indipendentemente dal fatto o dalla frequenza con cui si verifica. Questo è il vizio dello stesso principio considerato come una virtù. Il particolare design sopra le categorie di spazi equamente indipendentemente dalla loro frequenza; sacrificare che spesso sacrifica etichette marginali leggibili, che apprezzo molto. In questo esempio, le etichette di testo sembrano essere molto brevi, ma è tutt'altro che tipico.
Nota: i dati di xan sembrano solo essere inventati, quindi non proverò un'interpretazione più di quanto non venga tentato in altre risposte. Ma un po 'di saggezza casalinga merita qui l'ultima parola: il miglior design per te è quello che meglio trasmette a te e ai tuoi lettori la struttura di alcuni dati reali che ti interessano.
Altri esempi includono
Come puoi visualizzare la relazione tra 3 variabili categoriche?
Grafico per la relazione tra due variabili ordinali