Quali classificatori di machine learning sono i più parallelizzabili? Se avessi un problema di classificazione difficile, tempo limitato, ma una discreta LAN di computer con cui lavorare, quali classificatori proveresti?
Per contro mi sembra che alcuni classificatori standard che conosco impilino come segue ma potrei sbagliarmi totalmente:
Foreste casuali: molto parallelizzabili purché ogni macchina possa contenere tutti i dati (cioè non può dividere i dati di addestramento in sé, ma altrimenti parallelizzabili).
Promuovere -?
Support Vector Machine - Non molto parallelizzabile.
Alberi decisionali: possono essere suddivisi in parte, ma non in modo molto efficiente.