Statistiche e Big Data

Domande e risposte per le persone interessate alle statistiche, all'apprendimento automatico, all'analisi dei dati, al data mining e alla visualizzazione dei dati

4
Clustering di una matrice di correlazione
Ho una matrice di correlazione che indica come ogni articolo è correlato all'altro articolo. Quindi per un N articoli, ho già una matrice di correlazione N * N. Usando questa matrice di correlazione come posso raggruppare gli oggetti N nei bin M in modo da poter dire che gli oggetti …

3
Perché è richiesto il fattore di normalizzazione nel teorema di Bayes?
Il teorema di Bayes va P(model|data)=P(model)×P(data|model)P(data)P(model|data)=P(model)×P(data|model)P(data) P(\textrm{model}|\textrm{data}) = \frac{P(\textrm{model}) \times P(\textrm{data}|\textrm{model})}{P(\textrm{data})} Va tutto bene. Ma ho letto da qualche parte: Fondamentalmente, P (dati) non è altro che una costante normalizzante, cioè una costante che rende la densità posteriore integrata a una. Sappiamo che e . 0 ≤ P ( dati …


2
Scegli tra
Antefatto: sto dando una presentazione ai colleghi al lavoro sui test delle ipotesi e ne capisco la maggior parte, ma c'è un aspetto che mi sto annodando cercando di capire e spiegare agli altri. Questo è quello che penso di sapere (per favore correggilo se sbagli!) Le statistiche che sarebbero …


2
Caret train funziona per glmnet con convalida incrociata sia per alpha che lambda?
Il caretpacchetto R esegue la convalida incrociata su entrambi alphae lambdaper il glmnetmodello? In esecuzione questo codice, eGrid <- expand.grid(.alpha = (1:10) * 0.1, .lambda = (1:10) * 0.1) Control <- trainControl(method = "repeatedcv",repeats = 3,verboseIter =TRUE) netFit <- train(x =train_features, y = y_train, method = "glmnet", tuneGrid = eGrid, …


3
Approccio più delicato alle statistiche bayesiane
Di recente ho iniziato a leggere la 2a edizione di "Introduzione alla statistica bayesiana" di Bolstad. Ho avuto una lezione di statistica introduttiva che ha riguardato principalmente test statistici e sono quasi attraverso una lezione di analisi di regressione. Quali altri libri posso usare per integrare la mia comprensione di …

3
Come interpretare il termine di intercettazione in un GLM?
Sto usando R e ho analizzato i miei dati con GLM con collegamento binomiale. Voglio sapere qual è il significato dell'intercetta nella tabella di output. L'intercettazione di uno dei miei modelli è significativamente diversa, tuttavia la variabile no. Cosa significa questo? Qual è l'intercettazione. Non so se mi sto solo …




5
Perché preoccuparsi di approssimazioni di basso rango?
Se si dispone di una matrice con n righe e colonne m, è possibile utilizzare SVD o altri metodi per calcolare un'approssimazione di basso rango della matrice data. Tuttavia, l'approssimazione di basso rango avrà ancora n righe e m colonne. In che modo le approssimazioni di basso rango possono essere …


4
Intuizione statistica / senso dei dati
Sono uno studente universitario del secondo anno, sto studiando matematica e ho parlato con uno dei miei professori in merito alla differenza tra abilità matematica e capacità statistica. Una delle principali differenze che ha sollevato è stata il "senso dei dati", che ha spiegato come una combinazione di abilità tecnica …

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.