Oltre a evidenti caratteristiche classificatore come
- costo computazionale,
- tipi di dati previsti di caratteristiche / etichette e
- idoneità per determinate dimensioni e dimensioni dei set di dati,
quali sono i primi cinque (o 10, 20?) classificatori da provare prima su un nuovo set di dati di cui non si conosce ancora molto (ad esempio semantica e correlazione delle singole caratteristiche)? Di solito provo Naive Bayes, il vicino più vicino, l'albero decisionale e SVM - anche se non ho buone ragioni per questa selezione se non per conoscerli e soprattutto capire come funzionano.
Immagino che uno dovrebbe scegliere classificatori che coprono i più importanti approcci di classificazione generale . Quale selezione consiglieresti, secondo quel criterio o per qualsiasi altro motivo?
AGGIORNAMENTO: Una formulazione alternativa per questa domanda potrebbe essere: "Quali approcci generali alla classificazione esistono e quali metodi specifici coprono quelli più importanti / popolari / promettenti?"