Sono un nuovo arrivato nel machine learning (anche alcune statistiche), sto imparando le conoscenze (algoritmi di apprendimento supervisionato / non supervisionato, metodi di ottimizzazione pertinenti, regolarizzazioni, alcune filosofie (come il trade-off di bias-varianza?)) Per un po '. So che senza alcuna pratica reale, non otterrei una profonda comprensione di queste cose di apprendimento automatico.
Quindi inizio con qualche problema di classificazione con dati reali, diciamo la classificazione delle cifre scritta a mano (MNIST). Con mia sorpresa, senza alcun apprendimento / ingegneria delle funzionalità , l'accuratezza raggiunge 0,97 utilizzando il classificatore a foresta casuale con valori di pixel non elaborati come input. Ho anche provato altri algoritmi di apprendimento, come SVM, LR con parametri sintonizzati.
Poi mi sono perso, sarebbe troppo facile o mi manca qualcosa qui? Basta prendere un algoritmo di apprendimento dal toolkit e ottimizzare alcuni parametri?
Se ciò riguardasse in pratica l'apprendimento automatico, perderei il mio interesse in questo campo. Ho pensato e letto alcuni blog per alcuni giorni e sono giunto ad alcune conclusioni:
La parte più importante dell'apprendimento automatico in pratica è l' ingegnerizzazione delle funzionalità , ovvero, dati i dati, scoprire una migliore rappresentazione delle funzionalità.
Anche quale algoritmo di apprendimento da utilizzare è importante, anche la regolazione dei parametri, ma la scelta finale riguarda maggiormente la sperimentazione.
Non sono sicuro di capirlo correttamente, sperando che qualcuno possa correggermi e darmi qualche suggerimento sull'apprendimento automatico in pratica.