Di recente ho pubblicato un set di dati ( link ) con 369 classi. Ho fatto un paio di esperimenti su di loro per avere un'idea di quanto sia difficile il compito di classificazione. Di solito, mi piace se ci sono matrici di confusione per vedere il tipo di errore che viene fatto. Tuttavia, un matrice non è pratica.
C'è un modo per fornire le informazioni importanti sulle grandi matrici di confusione? Ad esempio, di solito ci sono molti 0 che non sono così interessanti. È possibile ordinare le classi in modo che la maggior parte delle voci diverse da zero si trovino intorno alla diagonale per consentire la visualizzazione di più matrici che fanno parte della matrice di confusione completa?
Ecco un esempio per una matrice di grande confusione .
Esempi in the Wild
La figura 6 di EMNIST sembra carina:
È facile vedere dove si trovano molti casi. Tuttavia, queste sono solo classi. Se l'intera pagina fosse utilizzata al posto di una sola colonna, questa potrebbe essere probabilmente 3 volte più, ma sarebbe comunque solo classi. Nemmeno vicino a 369 classi di HASY o 1000 di ImageNet.
Guarda anche
La mia domanda simile su CS.stackexchange