Statistiche e Big Data

Domande e risposte per le persone interessate alle statistiche, all'apprendimento automatico, all'analisi dei dati, al data mining e alla visualizzazione dei dati

1
Dalle reti bayesiane alle reti neurali: come la regressione multivariata può essere trasposta in una rete multi-output
Ho a che fare con un modello lineare gerarchico bayesiano , qui la rete lo descrive. YYY rappresenta le vendite giornaliere di un prodotto in un supermercato (osservato). XXX è una matrice nota di regressori, inclusi prezzi, promozioni, giorno della settimana, tempo, festività. SSS è il livello di inventario latente …

1
Esiste una spiegazione intuitiva del perché la regressione logistica non funzionerà per un caso di separazione perfetta? E perché l'aggiunta di regolarizzazione lo risolverà?
Abbiamo molte buone discussioni sulla separazione perfetta nella regressione logistica. Come ad esempio, la regressione logistica in R ha provocato una separazione perfetta (fenomeno di Hauck-Donner). E adesso? e il modello di regressione logistica non converge . Personalmente ritengo ancora che non sia intuitivo il motivo per cui sarà un …

1
Howlers causati dall'uso della regressione graduale
Sono ben consapevole dei problemi della selezione graduale / avanti / indietro nei modelli di regressione. Esistono numerosi casi di ricercatori che denunciano i metodi e indicano alternative migliori. Ero curioso di sapere se esistono delle storie in cui un'analisi statistica: ha usato la regressione graduale; fatto alcune conclusioni importanti …

3
Fare statistiche corrette in un ambiente di lavoro?
Non sono sicuro di dove appartenga questa domanda: Cross Validated o The Workplace. Ma la mia domanda è vagamente correlata alle statistiche. Questa domanda (o immagino domande) è nata durante il mio lavoro come "stagista di scienza dei dati". Stavo costruendo questo modello di regressione lineare ed esaminando la trama …
20 careers 



2
Prova che la statistica F segue la distribuzione F.
Alla luce di questa domanda: prova che i coefficienti in un modello OLS seguono una distribuzione t con gradi di libertà (nk) Mi piacerebbe capire perché F=(TSS−RSS)/(p−1)RSS/(n−p),F=(TSS−RSS)/(p−1)RSS/(n−p), F = \frac{(\text{TSS}-\text{RSS})/(p-1)}{\text{RSS}/(n-p)}, dove è il numero di parametri del modello e il numero di osservazioni e la varianza totale, la varianza residua, …

6
Completamento di una matrice di correlazione 3x3: due coefficienti dei tre dati
Mi è stata posta questa domanda in un'intervista. Diciamo che abbiamo una matrice di correlazione della forma ⎡⎣⎢10.60.80.61γ0.8γ1⎤⎦⎥[10.60.80.61γ0.8γ1]\begin{bmatrix}1&0.6&0.8\\0.6&1&\gamma\\0.8&\gamma&1\end{bmatrix} Mi è stato chiesto di trovare il valore di gamma, data questa matrice di correlazione. Ho pensato di poter fare qualcosa con gli autovalori, dal momento che dovrebbero essere tutti maggiori o …




1
Come possiamo simulare da una miscela geometrica?
Se f1,…,fkf1,…,fkf_1,\ldots,f_k sono densità note dalle quali posso simulare, ovvero per le quali è disponibile un algoritmo. e se il prodotto ∏i=1kfi(x)αiα1,…,αk>0∏i=1kfi(x)αiα1,…,αk>0\prod_{i=1}^k f_i(x)^{\alpha_i}\qquad \alpha_1,\ldots,\alpha_k>0 è integrabile, esiste un approccio generico per simulare da questa densità di prodotto usando i simulatori dififif_i ?

4
Qual è la differenza tra apprendimento e inferenza?
I documenti di ricerca sull'apprendimento automatico spesso trattano l'apprendimento e l'inferenza come due compiti separati, ma non mi è chiaro quale sia la distinzione. In questo libro, ad esempio, usano le statistiche bayesiane per entrambi i tipi di attività, ma non forniscono una motivazione per quella distinzione. Ho diverse idee …

3
Perché AUC = 1 persino il classificatore ha classificato erroneamente metà dei campioni?
Sto usando un classificatore che restituisce probabilità. Per calcolare l'AUC, sto usando il pacchetto R pROC. Le probabilità di output dal classificatore sono: probs=c(0.9865780, 0.9996340, 0.9516880, 0.9337157, 0.9778576, 0.8140116, 0.8971550, 0.8967585, 0.6322902, 0.7497237) probsmostra la probabilità di essere nella classe '1'. Come mostrato, il classificatore ha classificato tutti i campioni …

4
Codifica dei dati angolari per la rete neurale
Sto addestrando una rete neurale (dettagli non importanti) in cui i dati target sono un vettore di angoli (tra 0 e 2 * pi). Sto cercando consigli su come codificare questi dati. Ecco cosa sto provando attualmente (con successo limitato): 1) Codifica 1-of-C: inserisco i possibili angoli impostati in circa …

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.