Statistiche e Big Data

Domande e risposte per le persone interessate alle statistiche, all'apprendimento automatico, all'analisi dei dati, al data mining e alla visualizzazione dei dati



2
È insolito che il MEAN superi l'ARIMA?
Di recente ho applicato una serie di metodi di previsione (MEAN, RWF, ETS, ARIMA e MLP) e ho scoperto che MEAN ha fatto sorprendentemente bene. (MEAN: dove tutte le previsioni future sono previste uguali alla media aritmetica dei valori osservati.) MEAN ha persino sovraperformato ARIMA sulle tre serie che ho …



3
Apprendimento online vs offline?
Qual è la differenza tra apprendimento offline e online ? È solo una questione di apprendimento sull'intero set di dati (offline) rispetto all'apprendimento incrementale (un'istanza alla volta)? Quali sono esempi di algoritmi utilizzati in entrambi?

3
Applica le incorporazioni di parole all'intero documento per ottenere un vettore di funzione
Come si usa l'incorporamento di parole per mappare un documento su un vettore di caratteristiche, adatto per l'uso con l'apprendimento supervisionato? Una parola che incorpora mappa ogni parola su un vettore , dove è un numero non troppo grande (ad esempio, 500). Gli incorporamenti di parole popolari includono word2vec e …

4
Qual è l'invarianza della traduzione nella visione artificiale e nella rete neurale convoluzionale?
Non ho un background di visione artificiale, eppure quando leggo alcuni articoli e documenti relativi all'elaborazione delle immagini e alle reti neurali convoluzionali, devo costantemente affrontare il termine translation invariance, o translation invariant. O ho letto molto che l'operazione di convoluzione prevede translation invariance? !! Cosa significa questo? Io stesso …



3
Quali sono le differenze tra 'epoch', 'batch' e 'minibatch'?
Per quanto ne so, quando adotto la Discendenza gradiente stocastica come algoritmo di apprendimento, qualcuno usa "epoca" per il set di dati completo e "batch" per i dati utilizzati in una singola fase di aggiornamento, mentre un altro usa rispettivamente "batch" e "minibatch" e gli altri usano "epoca" e "minibatch". …


3
Deriva la varianza del coefficiente di regressione nella regressione lineare semplice
Nella regressione lineare semplice, abbiamo y=β0+β1x+uy=β0+β1x+uy = \beta_0 + \beta_1 x + u , dove u∼iidN(0,σ2)u∼iidN(0,σ2)u \sim iid\;\mathcal N(0,\sigma^2) . Ho derivato lo stimatore: β1^=∑i(xi−x¯)(yi−y¯)∑i(xi−x¯)2 ,β1^=∑i(xi−x¯)(yi−y¯)∑i(xi−x¯)2 , \hat{\beta_1} = \frac{\sum_i (x_i - \bar{x})(y_i - \bar{y})}{\sum_i (x_i - \bar{x})^2}\ , dovex¯x¯\bar{x} ey¯y¯\bar{y} sono i mezzi di campionamento dixxxedyyy. Ora voglio trovare …

3
Numero casuale-Set.seed (N) in R [duplicato]
Questa domanda ha già una risposta qui: Cos'è esattamente un seme in un generatore di numeri casuali? 3 risposte Mi rendo conto che uno usa set.seed()in R per la generazione di numeri pseudo-casuali. Mi rendo anche conto che usando lo stesso numero, come le set.seed(123)assicurazioni, puoi riprodurre i risultati. Ma …

2
Quando Poisson e le regressioni binomiali negative si adattano agli stessi coefficienti?
Ho notato che in R, Poisson e le regressioni binomiali negative (NB) sembrano sempre corrispondere agli stessi coefficienti per i predittori categorici, ma non continui. Ad esempio, ecco una regressione con un predittore categorico: data(warpbreaks) library(MASS) rs1 = glm(breaks ~ tension, data=warpbreaks, family="poisson") rs2 = glm.nb(breaks ~ tension, data=warpbreaks) #compare …

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.