Ho un background nella programmazione informatica e nella teoria dei numeri elementare, ma nessuna vera formazione statistica e recentemente ho "scoperto" che il fantastico mondo di un'intera gamma di tecniche è in realtà un mondo statistico. Sembra che le fattorizzazioni di matrici, il completamento di matrici, i tensori ad alta dimensione, gli incorporamenti, la stima della densità, l'inferenza bayesiana, le partizioni di Markov, il calcolo degli autovettori, il PageRank siano tutte tecniche altamente statistiche e che gli algoritmi di apprendimento automatico che usano tali cose, usano molte statistiche .
Il mio obiettivo è quello di essere in grado di leggere articoli che discutono di tali cose e implementare o creare gli algoritmi, comprendendo al contempo la notazione, le "prove" e gli argomenti statistici utilizzati. Immagino che la cosa più difficile sia seguire tutte le prove che coinvolgono le matrici.
Quali documenti di base possono iniziare? O un buon libro di testo con esercizi che vale la pena di lavorare?
Nello specifico, alcuni articoli che vorrei comprendere completamente sono:
- Esatto completamento della matrice tramite ottimizzazione convessa, Candes, Recht, 2008
- The Fast Cauchy Transform e Faster Robust Regressione lineare, Clarkson et al, 2013
- Proiezioni casuali per Support Vector Machines, Paul et al, 2013
- Stima della probabilità ad alta dimensione con modelli di densità profonda, Rippel, Adams, 2013
- Ottenere stime di minimizzazione degli errori e limiti di errore universali per il completamento della matrice di basso rango, Király, Theran, 2013