Un solido background in matematica è un requisito totale per ML? - una risposta e alcune speculazioni per ML concettualizzate come statistiche ;-)
Intorno al 1990 speravo che l'algebra del computer fosse di aiuto, penso che sia, ma è abbastanza limitata. Ma aiuta sicuramente ad accelerare l'apprendimento della matematica (meno necessità di sviluppare abilità manipolatorie mediante la pratica o cercare di cavarsela semplicemente facendo i semplici esercizi). Ho trovato l'algebra lineare di Fred Szabo con Mathematica un eccellente esempio di questo (ma avevo già seguito un corso di algebra lineare a livello di teoria avanzata).
Lavoro dal 1988 (Utilizzo di metodi intensivi per computer per "concretizzare" teoremi e principi dalla statistica - Precisamente) per rendere la risposta no o almeno non necessaria (per le statistiche). Uno sarà sempre in grado di capire più rapidamente e più in generale con ulteriori abilità e comprensione matematica. Penso che sto iniziando ad avvicinarmi, ma è necessaria una rappresentazione manipolabile dei modelli e delle inferenze che generano probabilità che sia valida e utile per più di semplici problemi di giocattoli.
Dovrei provare a riempire gli spazi vuoti della mia matematica prima di continuare con ML?
Questo è uno sforzo arduo: in MHO quasi tutti quelli che comprendono le statistiche sono arrivati agevolmente manipolando le rappresentazioni matematiche standard e soprattutto non standard di modelli generatori di probabilità e caratterizzazioni matematiche di inferenza (il massimo x% di Phd di statistiche matematiche). Quindi non si tratta solo di apprendere le basi, ma di essere davvero a proprio agio con la matematica. (A parte questo, per me la teoria di Fourier era essenziale.)
Perché queste rappresentazioni sono difficili (anche con molta matematica)?
Gerd Gigerenzer ha praticamente stabilito che non vi è alcuna sfida con la semplice malattia positiva / negativa dato il problema positivo / negativo del test che utilizza le frequenze _naturali ”. Un riferimento alla domanda collegata sembra fare buon uso di quel http://www.autonlab.org/tutorials/prob18.pdf
Perché è difficile generalizzare?
Per k test (ripetuti o diversi) - 2 ^ k
Per i test che accettano valori v - v ^ k
Quindi, per binario sconosciuto - 2 * v ^ k probabilità del percorso di esempio
Per p più sconosciuti binari 2 ^ p * v ^ k
Per p più incognite razionali Q ^ p * v ^ k
Si passa rapidamente alla matematica con infiniti numerabili e innumerevoli per far fronte a questo, che anche con competenza matematica porta a molti fraintendimenti e apparenti paradossi (ad esempio il paradosso di Borel?)
Inoltre, vi sono incomprensioni pericolose da lineari a non lineari (ad es. Pericoli nascosti in cui si specificano Winbugs Priori non informativi e altri MCMC senza informazioni per la distribuzione precedente ) e interazioni ed effetti casuali, ecc.