Domande e risposte per le persone interessate alle statistiche, all'apprendimento automatico, all'analisi dei dati, al data mining e alla visualizzazione dei dati
Sono rimasto impressionato dai risultati del documento ICML 2014 " Rappresentazioni distribuite di frasi e documenti " di Le e Mikolov. La tecnica che descrivono, chiamata "vettori di paragrafo", apprende rappresentazioni senza supervisione di paragrafi / documenti arbitrariamente lunghi, basati su un'estensione del modello word2vec. Il documento riporta prestazioni all'avanguardia …
So che eseguire l'ottimizzazione dell'iperparametro al di fuori della convalida incrociata può portare a stime distorte della validità esterna, poiché il set di dati utilizzato per misurare le prestazioni è lo stesso utilizzato per ottimizzare le funzionalità. Quello che mi chiedo è quanto sia grave questo problema . Posso capire …
Di seguito sono riportati i grafici acf e pacf di una serie di dati mensile. La seconda trama è acf con ci.type = 'ma': La persistenza di valori elevati nel diagramma acf rappresenta probabilmente una tendenza positiva a lungo termine. La domanda è se questo rappresenta una variazione stagionale? Ho …
Comprendo che la differenza tra loro è correlata al fatto che la variabile di raggruppamento nel modello sia stimata come un effetto fisso o casuale, ma non mi è chiaro perché non siano gli stessi (se non sono uguali). Sono particolarmente interessato a come funziona quando si utilizza la stima …
Sono interessato a comprendere meglio il metodo delta per l'approssimazione degli errori standard degli effetti marginali medi di un modello di regressione che include un termine di interazione. Ho esaminato le domande correlate sotto il delta-method ma nessuno ha fornito esattamente quello che sto cercando. Considera i seguenti dati di …
So calcolare matematicamente PCA e SVD e so che entrambi possono essere applicati alla regressione dei minimi quadrati lineari. Il vantaggio principale di SVD matematicamente sembra essere che può essere applicato a matrici non quadrate. Entrambi si concentrano sulla decomposizione della matriceA parte il vantaggio di SVD menzionato, ci sono …
Secondo la mia comprensione, in PCA sulla base di correlazioni otteniamo caricamenti di fattori (= componente principale in questo caso) che non sono altro che correlazioni tra variabili e fattori. Ora, quando ho bisogno di generare punteggi dei fattori in SPSS, posso ottenere direttamente i punteggi dei fattori di ciascun …
Il concetto di "media" è molto più ampio della media aritmetica tradizionale; si estende fino a includere la mediana? Per analogia, raw data⟶idraw data⟶meanraw mean⟶id−1arithmetic meanraw data⟶recipreciprocals⟶meanmean reciprocal⟶recip−1harmonic meanraw data⟶loglogs⟶meanmean log⟶log−1geometric meanraw data⟶squaresquares⟶meanmean square⟶square−1root mean squareraw data⟶rankranks⟶meanmean rank⟶rank−1medianraw data⟶idraw data⟶meanraw mean⟶id−1arithmetic meanraw data⟶recipreciprocals⟶meanmean reciprocal⟶recip−1harmonic meanraw data⟶loglogs⟶meanmean log⟶log−1geometric meanraw data⟶squaresquares⟶meanmean square⟶square−1root …
In R, quando ho un (generalizzato) modello lineare ( lm, glm, gls, glmm, ...), come posso testare il coefficiente (pendenza di regressione) contro un valore diverso da 0? Nel riassunto del modello, i risultati del test t del coefficiente vengono automaticamente riportati, ma solo per il confronto con 0. Voglio …
Se è un vettore casuale e è una matrice fissa, qualcuno potrebbe spiegare perché A c o v [ A Z ] = A c o v [ Z ] A ⊤ .ZZ\mathbf {Z}UNUNAc o v [A Z ]=A c o v [ Z ] A⊤.cov[UNZ]=UNcov[Z]UN⊤.\mathrm{cov}[A \mathbf {Z}]= A \mathrm{cov}[\mathbf …
Consenti a un modello di regressione lineare ottenuto dalla funzione R che vorrei sapere se è possibile ottenere con il comando Errore quadrato medio. Ho avuto l'uscita SEGUENTE di un esempio > lm <- lm(MuscleMAss~Age,data) > sm<-summary(lm) > sm Call: lm(formula = MuscleMAss ~ Age, data = data) Residuals: Min …
Ho appena letto alcune informazioni sul campionamento di Gibbs e sull'algoritmo Metropolis Hastings e ho un paio di domande. A quanto ho capito, nel caso del campionamento di Gibbs, se abbiamo un grosso problema multivariato, campioniamo dalla distribuzione condizionale, cioè campioniamo una variabile mantenendo tutte le altre fisse mentre in …
Ho un set di dati composto da 5 funzioni: A, B, C, D, E. Sono tutti valori numerici. Invece di fare un clustering basato sulla densità, quello che voglio fare è raggruppare i dati in modo simile ad un albero decisionale. L'approccio intendo è qualcosa del genere: L'algoritmo può dividere …
Al giorno d'oggi, con tutti i media e le discussioni sull'apprendimento profondo, ho letto alcune cose elementari al riguardo. Ho appena scoperto che è solo un altro metodo di apprendimento automatico per apprendere modelli dai dati. Ma la mia domanda è: dove brilla e perché questo metodo brilla? Perché tutti …
Considera le osservazioni censurate a destra, con eventi a volte . Il numero di individui sensibili al momento i è n i e il numero di eventi al momento i è d i .t1, t2, ...t1,t2,…t_1, t_2, \dotsioiinionin_iioiidiodid_i Kaplan-Meier o lo stimatore del prodotto emerge naturalmente come MLE quando la …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.