Proverò a rispondere a questa domanda con una combinazione di prove pubblicate, esperienza personale e speculazioni.
A) Prove pubblicate.
L'unico documento che conosco per aiutare a rispondere alla domanda è Delgado et al 2014: abbiamo bisogno di centinaia di classificatori per risolvere i problemi di classificazione del mondo reale? - JMLR che esegue centinaia di diversi algoritmi e implementazioni su 121 set di dati dell'UCI. Scoprono che sebbene RBF SVM non sia l'algoritmo "migliore" (sono foreste casuali se ricordo bene), è tra i primi 3 (o 5).
Se consideri che la loro selezione di set di dati è un "buon campione" di problemi del mondo reale, allora SVM è definitivamente un algoritmo che dovrebbe essere provato su nuovi problemi ma si dovrebbe prima provare la foresta casuale!
I limiti alla generalizzazione di quel risultato sono che i set di dati sono quasi tutti alti e magri (n >> p), non molto sparsi - cosa che suppongo dovrebbe essere più un problema per RF, e non molto grande (sia n che p).
Infine, sempre sulla base delle prove pubblicate, raccomando due siti che confrontano diverse implementazioni di foreste casuali:
B) Esperienza personale.
Credo che documenti come Delgado e tutti molto importanti per la comunità dell'apprendimento automatico, quindi ho cercato di replicare i loro risultati in condizioni diverse. Ho eseguito circa 15 algoritmi diversi su oltre 100 set di dati binari (dal set di set di dati di Delgado). Penso anche di essere stato più attento alla selezione degli iperparametri di loro.
I miei risultati sono che SVM era il "miglior algoritmo" (media rango 4.9). La mia opinione è che SVM abbia passato RF perché il set di dati originale conteneva molti problemi multiclasse - di cui parlerò nella parte speculazione - dovrebbe essere un problema per SVM.
MODIFICA (giu / 16):
Ma la RF è molto più veloce, ed è stato il secondo miglior algoritmo (rango medio 5.6) seguito da gbm (5.8), nnets (7.2) e così via). Non ho provato la regressione logistica standard in questi problemi, ma ho provato una rete elastica (L1 e L2 regolarizzata LR) ma non ha funzionato bene (media rango 8.3) ~
Non ho ancora finito di analizzare i risultati o di scrivere il documento, quindi non posso nemmeno indicare un rapporto tecnico con i risultati. Spero che tra qualche settimana potrò modificare nuovamente questa risposta e indicare un rapporto tecnico con i risultati.
Il documento è disponibile all'indirizzo http://arxiv.org/abs/1606.00930 Dopo l'analisi completa, RF e SVM sono quasi equivalenti in termini di tasso di errore previsto e SVM è il più veloce (con mia grande sorpresa !!). Non sono più così enfatico nel raccomandare la RF (per motivi di velocità).
Quindi la mia esperienza personale è che sebbene SVM possa darti un po 'più di precisione, è quasi sempre una scelta migliore usare una RF.
Anche per problemi più grandi, potrebbe essere impossibile utilizzare un solutore SVM batch (non ho mai usato un solutore SVM online come LASVM o altri).
Alla fine ho usato la regressione logistica solo in una situazione. Stavo facendo un po 'di "intenso" ingegnerizzazione delle caratteristiche su un problema di classificazione delle immagini (come - combinare o meno due diverse descrizioni dell'immagine e la dimensionalità delle descrizioni). E ho usato la regressione logistica per selezionare tra le molte alternative (perché non esiste una ricerca di iperparametri in LR). Una volta stabilite le migliori caratteristiche (secondo LR) abbiamo usato una RF (selezionando i migliori iperparametri) per ottenere il classificatore finale.
C) Speculazione
Non ho mai lavorato seriamente su problemi multiclasse, ma ho la sensazione che SVM non sia così bravo con loro. Il problema non è il problema tra le soluzioni one-vs-one o one-vs-all, ma che tutte le implementazioni che conosco useranno gli stessi iperparametri per tutti i classificatori (OVO o OVA). La selezione degli iperparametri corretti per SVM è così costosa che nessuna delle implementazioni standard che conosco farà una ricerca per ogni classificatore. Suppongo che questo sia un problema per SVM (ma non un problema per RF !!).
Poi di nuovo, per problemi multiclasse andrei direttamente in RF.