Sto cercando di mettere insieme un curriculum di matematica auto-diretto per preparare l'apprendimento del data mining e dell'apprendimento automatico. Ciò è motivato avviando il corso di machine learning di Andrew Ng su Coursera e sentendo che prima di procedere avevo bisogno di migliorare le mie abilità matematiche. Mi sono laureato un po 'di tempo fa, quindi la mia algebra e le statistiche (in particolare le lezioni di scienze politiche / psicologia) sono arrugginite.
Le risposte nel thread Un forte background in matematica è un requisito totale per ML? suggerire solo libri o lezioni direttamente collegati all'apprendimento automatico; Ho già esaminato alcune di quelle classi e libri e non so esattamente quale argomento di matematica studiare (ad esempio: quale campo di indirizzo matematico deriva un'equazione per "minimizzare una funzione di costo"?). L'altro thread suggerito ( competenze e corsi necessari per essere un analista di dati ) menziona solo ampie categorie di competenze necessarie per l'analisi dei dati. Il thread Introduzione alla statistica per i matematici non si applica perché non ho già una laurea in matematica; un thread simile Mathematician vuole la conoscenza equivalente ad un grado statistico di qualità ha un incredibile elenco di libri statistici, ma ancora una volta, sto guardando iniziare la matematica da un ricordo arrugginito di algebra e risalire da lì.
Quindi, per coloro che lavorano nel machine learning e nel data mining, quali campi matematici trovi essenziali per svolgere il tuo lavoro? Quali materie matematiche suggeriresti di preparare per il data mining e l'apprendimento automatico e in quale ordine? Ecco l'elenco e l'ordine che ho finora:
- Algebra
- Pre-calcolo
- Calcolo
- Algebra lineare
- Probabilità
- Statistiche (molti sottocampi diversi qui, ma non sanno come spezzarli)
Per quanto riguarda il data mining e l'apprendimento automatico, attraverso il mio lavoro attuale ho accesso ai record sull'attività del sito Web / app, sulle transazioni cliente / abbonamento e sui dati immobiliari (sia statici che temporali). Spero di applicare il data mining e l'apprendimento automatico a questi set di dati.
Grazie!
MODIFICARE:
Per amor dei posteri, volevo condividere un'autovalutazione matematica utile per il corso Intro to Machine Learning di Geoffrey Gordon / Alex Smola al CMU.