Statistiche e Big Data

Domande e risposte per le persone interessate alle statistiche, all'apprendimento automatico, all'analisi dei dati, al data mining e alla visualizzazione dei dati


2
Bayesiano pensa al sovradimensionamento
Ho dedicato molto tempo allo sviluppo di metodi e software per la validazione di modelli predittivi nel tradizionale dominio statistico frequentista. Nel mettere in pratica più idee bayesiane e nell'insegnamento vedo alcune differenze chiave da abbracciare. In primo luogo, la modellazione predittiva bayesiana chiede all'analista di riflettere attentamente sulle distribuzioni …

5
Perché l'ingegneria delle funzioni funziona?
Recentemente ho imparato che uno dei modi per trovare soluzioni migliori per i problemi di ML è attraverso la creazione di funzionalità. Si può fare per esempio sommando due funzionalità. Ad esempio, possediamo due caratteristiche: "attacco" e "difesa" di un qualche tipo di eroe. Creiamo quindi funzionalità aggiuntive chiamate "totale" …


2
Che senso ha fare OLS dopo la selezione delle variabili LASSO?
Recentemente ho scoperto che nella letteratura di econometria applicata, quando si affrontano i problemi di selezione delle caratteristiche, non è raro eseguire LASSO seguito da una regressione OLS usando le variabili selezionate. Mi chiedevo come possiamo qualificare la validità di tale procedura. Causerà problemi come le variabili omesse? Qualche prova …



2
Dalla distribuzione uniforme alla distribuzione esponenziale e viceversa
Questa è probabilmente una domanda banale, ma la mia ricerca è stata infruttuosa finora, tra cui questo articolo di Wikipedia , e il "Compendio della Distribuzioni" del documento . Se XXX ha una distribuzione uniforme, significa che segue una distribuzione esponenziale?eXeXe^X Allo stesso modo, se segue una distribuzione esponenziale, significaYYYln(Y)ln(Y)ln(Y) …

4
Differenza tra feedback RNN ​​e LSTM / GRU
Sto cercando di comprendere diverse architetture di reti neurali ricorrenti (RNN) da applicare ai dati delle serie temporali e mi sto confondendo un po 'con i diversi nomi che vengono frequentemente utilizzati nella descrizione di RNN. La struttura della memoria a breve termine (LSTM) e della Gated Recurrent Unit (GRU) …


2
Nelle reti neurali, perché usare metodi a gradiente piuttosto che altre metaeuristiche?
Nell'addestramento di reti neurali profonde e superficiali, perché sono comunemente usati i metodi a gradiente (ad es. Discesa a gradiente, Nesterov, Newton-Raphson) rispetto ad altre metaeuristiche? Per metaeuristica intendo metodi come ricottura simulata, ottimizzazione delle colonie di formiche, ecc., Che sono stati sviluppati per evitare di rimanere bloccati in un …

1
Come LDA, una tecnica di classificazione, funge anche da tecnica di riduzione della dimensionalità come la PCA
In questo articolo , l'autore collega l'analisi discriminante lineare (LDA) all'analisi dei componenti principali (PCA). Con le mie conoscenze limitate, non sono in grado di seguire come LDA possa essere in qualche modo simile alla PCA. Ho sempre pensato che la LDA fosse una forma di algoritmo di classificazione, simile …




Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.