Gli algoritmi in linea si riferiscono a calcoli eseguiti in modo iterativo, con i dati che arrivano durante il calcolo. Per domande incentrate su Internet, utilizza il tag "internet".
Qual è la differenza tra apprendimento offline e online ? È solo una questione di apprendimento sull'intero set di dati (offline) rispetto all'apprendimento incrementale (un'istanza alla volta)? Quali sono esempi di algoritmi utilizzati in entrambi?
Un documento "Calcolo accurato della varianza corrente" all'indirizzo http://www.johndcook.com/standard_deviation.html mostra come calcolare media corrente, varianza e deviazioni standard. Esistono algoritmi in cui i parametri di un modello di regressione lineare o logistica possono essere similmente aggiornati "dinamicamente" man mano che viene fornito ogni nuovo record di addestramento?
Ultimamente ho lavorato con set di dati di grandi dimensioni e ho trovato molti documenti sui metodi di streaming. Per dirne alcuni: Follow-the-Regularized Leader e Mirror Descent: Equivalence Teorems and L1 Regularization ( http://jmlr.org/proceedings/papers/v15/mcmahan11b/mcmahan11b.pdf ) Apprendimento in streaming: SVM One-Pass ( http://www.umiacs.umd.edu/~hal/docs/daume09onepass.pdf ) Pegasos: Primal stimato Sub-GrAdient SOlver per SVM …
Ho una matrice di valori reali, che ha media e deviazione standard . Se un elemento dell'array viene sostituito da un altro elemento , allora sarà la nuova mediannnμoldμold\mu_{old}σoldσold\sigma_{old}xixix_ixjxjx_j μnew=μold+xj−xinμnew=μold+xj−xin\mu_{new}=\mu_{old}+\frac{x_j-x_i}{n} Il vantaggio di questo approccio è che richiede un calcolo costante indipendentemente dal valore di . Esiste un approccio per …
Ho un piccolo problema che mi sta facendo impazzire. Devo scrivere una procedura per un processo di acquisizione online di una serie temporale multivariata. Ad ogni intervallo di tempo (ad esempio 1 secondo), ottengo un nuovo campione, che è fondamentalmente un vettore a virgola mobile di dimensione N. L'operazione che …
Al momento ho letto l'articolo Efficient Online and Batch Learning usando Forward-Backward Splitting di John Duchi e Yoram Singer. Sono molto confuso sull'uso dei termini "Online" e "Batch". Ho pensato "Online" significa che aggiorniamo i parametri di peso dopo aver elaborato un'unità dei dati di allenamento. Quindi utilizziamo i nuovi …
Esistono formule online ben note per il calcolo delle medie mobili ponderate esponenzialmente e delle deviazioni standard di un processo . Per la media,(xn)n=0,1,2,…(xn)n=0,1,2,…(x_n)_{n=0,1,2,\dots} μn=(1−α)μn−1+αxnμn=(1−α)μn−1+αxn\mu_n = (1-\alpha) \mu_{n-1} + \alpha x_n e per la varianza σ2n=(1−α)σ2n−1+α(xn−μn−1)(xn−μn)σn2=(1−α)σn−12+α(xn−μn−1)(xn−μn)\sigma_n^2 = (1-\alpha) \sigma_{n-1}^2 + \alpha(x_n - \mu_{n-1})(x_n - \mu_n) da cui è possibile calcolare …
Diciamo che ho un classificatore di regressione logistica. Nell'apprendimento in batch normale, avrei un termine di regolarizzazione per prevenire un eccesso di adattamento e mantenere i miei pesi piccoli. Inoltre normalizzerei e ridimensionerei le mie funzionalità. In un ambiente di apprendimento online, sto ottenendo un flusso continuo di dati. Faccio …
Avevo usato il termine "Caso Heywood" in modo un po 'informale per riferirmi a situazioni in cui una stima online "risposta limitata" aggiornata iterativamente della varianza è diventata negativa a causa di problemi di precisione numerica. (Sto usando una variante del metodo di Welford per aggiungere dati e rimuovere dati …
Devo calcolare i quartili (Q1, mediana e Q3) in tempo reale su un ampio set di dati senza memorizzare le osservazioni. Per prima cosa ho provato l'algoritmo P square (Jain / Chlamtac) ma non ero soddisfatto (un po 'troppo utilizzo della CPU e non convinto almeno dalla precisione sul mio …
Qualcuno può indicarmi la direzione di un algoritmo online (ricorsivo) per la regolarizzazione di Tikhonov (minimi quadrati regolarizzati)? In un'impostazione offline, calcolerei usando il mio set di dati originale dove λ si trova usando la convalida incrociata n-fold. È possibile prevedere un nuovo valore y per un dato x usando …
Ciò è stato ispirato dalla regressione lineare online efficiente , che ho trovato molto interessante. Esistono testi o risorse dedicati al calcolo statistico su larga scala, mediante il quale il calcolo con insiemi di dati è troppo grande per adattarsi alla memoria principale e forse troppo vario per essere effettivamente …
Ultimamente ho cercato di saperne di più sull'apprendimento online (è assolutamente affascinante!), E un tema su cui non sono stato in grado di capire bene è come pensare alla selezione dei modelli in contesti offline e online. In particolare, supponiamo ci alleniamo un classificatore non in linea, sulla base di …
Voglio implementare una regressione gaussiana incrementale usando una finestra scorrevole sui punti dati che arrivano uno ad uno attraverso un flusso. Permettere ddddenota la dimensionalità dello spazio di input. Quindi, ogni punto datiXioXiox_i ha ddd numero di elementi. Permettere nnn essere la dimensione della finestra scorrevole. Per fare previsioni, devo …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.