Voglio stimare il quantile di alcuni dati. I dati sono così enormi che non possono essere inseriti nella memoria. E i dati non sono statici, i nuovi dati continuano ad arrivare. Qualcuno conosce qualche algoritmo per monitorare i quantili dei dati osservati finora con memoria e calcolo molto limitati? Trovo …
Ogni libro di testo che ho visto finora descrive algoritmi ML e come implementarli. Esiste anche un libro di testo che costruisce teoremi e prove per il comportamento di quegli algoritmi? es. affermando che nelle condizioni , la discesa del gradiente porterà sempre ad A , B , C ?x,y,zx,y,zx,y,zA,B,CA,B,CA,B,C
Questa domanda riguarda un modo efficiente per calcolare i componenti principali. Molti testi su PCA lineare sostengono l'uso della decomposizione a valore singolare dei dati casewise . Cioè, se abbiamo dati e vogliamo sostituire le variabili (le sue colonne ) con i componenti principali, facciamo SVD: , valori singolari (radici …
Devo chiarire immediatamente che sono uno sviluppatore di software praticante, non uno statistico, e che la mia classe di statistiche del college era molto tempo fa ... Detto questo, vorrei sapere se esiste un metodo per accumulare una serie di statistiche descrittive che potrebbero quindi essere utilizzate per produrre un …
Ho letto un bel po 'di modelli Markov nascosti e sono stato in grado di codificarne una versione piuttosto semplice. Ma ci sono due modi principali che mi sembra di imparare. Uno è di leggerlo e implementarlo nel codice (che è fatto) e il secondo è capire come si applica …
Dopo aver eseguito l'analisi dei componenti principali (PCA), voglio proiettare un nuovo vettore nello spazio PCA (ovvero trovare le sue coordinate nel sistema di coordinate PCA). Ho calcolato PCA in linguaggio R utilizzando prcomp. Ora dovrei essere in grado di moltiplicare il mio vettore per la matrice di rotazione PCA. …
Ho difficoltà a generare una serie di serie temporali colorate stazionarie, data la loro matrice di covarianza (densità di potenza spettrale (PSD) e densità spettrale di potenza incrociata (CSD)). So che, date due serie temporali e , posso stimare la loro densità spettrale di potenza (PSD) e densità spettrale incrociata …
migrato da math.stackexchange . Sto elaborando un lungo flusso di numeri interi e sto considerando di tenere traccia di alcuni momenti per poter calcolare approssimativamente vari percentili per il flusso senza memorizzare molti dati. Qual è il modo più semplice per calcolare percentili da pochi istanti. Esiste un approccio migliore …
Non sono un esperto di foreste casuali ma capisco chiaramente che il problema chiave con la foresta casuale è la generazione di alberi (casuali). Puoi spiegarmi come vengono generati gli alberi? (ovvero qual è la distribuzione utilizzata per la generazione di alberi?) Grazie in anticipo !
Sto cercando di confrontare la complessità computazionale / la velocità di stima di tre gruppi di metodi per la regressione lineare, come distinto in Hastie et al. "Elements of Statistical Learning" (2a edizione), capitolo 3: Selezione del sottoinsieme Metodi di restringimento Metodi che utilizzano direzioni di input derivate (PCR, PLS) …
L'implementazione di ER è più efficiente ( Extreme Gradient Boostingè come aumentare il gradiente) - la differenza è importante dal punto di vista pratico? C'è un pacchetto R che li implementa. È un nuovo algoritmo che supera l'implementazione "generica" (pacchetto RandomForest da R) non solo in termini di efficienza o …
Devo calcolare la distanza di Mahalanobis del campione in R tra ogni coppia di osservazioni in una matrice di covariate. Ho bisogno di una soluzione efficiente, ovvero vengono calcolate solo distanze, e preferibilmente implementate in C / RCpp / Fortran ecc. Suppongo che , la matrice di covarianza della popolazione, …
Supponiamo di avere una matrice densa di dimensioni , con decomposizione SVDIn posso calcolare la SVD come segue: .AA \textbf{A}m×nm×nm \times nA=USV⊤.A=USV⊤.\mathbf{A}=\mathbf{USV}^\top.Rsvd(A) Se una nuova riga viene aggiunta a , si può calcolare la nuova decomposizione SVD sulla base di quella vecchia (cioè usando , e ), senza ricalcolare SVD …
È possibile eseguire una regressione del log in R utilizzando tale codice: > library(MASS) > data(menarche) > glm.out = glm(cbind(Menarche, Total-Menarche) ~ Age, + family=binomial(logit), data=menarche) > coefficients(glm.out) (Intercept) Age -21.226395 1.631968 Sembra che l'algoritmo di ottimizzazione sia converto - ci sono informazioni sul numero di passaggi dell'algoritmo di punteggio …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.