Statistiche e Big Data

Domande e risposte per le persone interessate alle statistiche, all'apprendimento automatico, all'analisi dei dati, al data mining e alla visualizzazione dei dati


2
Qual è la differenza tra PCA e PCA asintotico?
In due articoli del 1986 e del 1988 , Connor e Korajczyk hanno proposto un approccio alla modellizzazione dei rendimenti delle attività. Dato che queste serie temporali di solito hanno più risorse rispetto alle osservazioni sul periodo, hanno proposto di eseguire un PCA sulle covarianze trasversali dei rendimenti delle attività. …
23 pca  econometrics 




2
Statistica forense: Benford e oltre
Quali sono i metodi generali per rilevare frodi, anomalie, confusione, ecc. Nelle opere scientifiche prodotte da terzi? (Sono stato motivato a chiedere questo dalla recente vicenda Marc Hauser .) Di solito per frode elettorale e contabile, viene citata una variante della legge di Benford . Non sono sicuro di come …



1
Spiegazione di min_child_weight nell'algoritmo xgboost
La definizione del parametro min_child_weight in xgboost è data come: somma minima del peso dell'istanza (hessiana) necessaria in un bambino. Se il passaggio della partizione dell'albero risulta in un nodo foglia con la somma del peso dell'istanza inferiore a min_child_weight, il processo di costruzione rinuncerà a un ulteriore partizionamento. In …

1
Quali sono esattamente i meccanismi di attenzione?
Negli ultimi anni sono stati utilizzati meccanismi di attenzione in vari articoli di Deep Learning. Ilya Sutskever, responsabile della ricerca presso Open AI, li ha entusiasti con entusiasmo: https://towardsdatascience.com/the-fall-of-rnn-lstm-2d1594c74ce0 Eugenio Culurciello alla Purdue University ha affermato che le RNN e le LSTM dovrebbero essere abbandonate a favore di reti neurali …


2
Perché esistono due diverse formule / notazioni di perdita logistica?
Ho visto due tipi di formulazioni logistiche di perdita. Possiamo facilmente dimostrare che sono identici, l'unica differenza è la definizione dell'etichetta yyy . Formulazione / notazione 1, y∈{0,+1}y∈{0,+1}y \in \{0, +1\} : L(y,βTx)=−ylog(p)−(1−y)log(1−p)L(y,βTx)=−ylog⁡(p)−(1−y)log⁡(1−p) L(y,\beta^Tx)=-y\log(p)-(1-y)\log(1-p) dove p=11+exp(−βTx)p=11+exp⁡(−βTx)p=\frac 1 {1+\exp(-\beta^Tx)} , in cui la funzione logistica associa un numero realeβTxβTx\beta^T xa intervalli …

3
Un
Questa domanda è stata migrata dallo Stack Overflow perché è possibile rispondere su Convalida incrociata. Migrato 3 anni fa . Nelle statistiche stiamo facendo regressioni lineari, il loro inizio. In generale, sappiamo che maggiore è l' meglio è, ma c'è mai uno scenario in cui un R 2 alto sarebbe …


3
Discesa coordinata vs. pendenza
Mi chiedevo quali sono i diversi casi d'uso per i due algoritmi, Coordinate Descent e Gradient Descent . So che la discesa delle coordinate ha problemi con funzioni non fluide, ma è utilizzata in algoritmi popolari come SVM e LASSO. Penso che la discesa gradiente sia usata più ampiamente, specialmente …

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.