Statistiche e Big Data

Domande e risposte per le persone interessate alle statistiche, all'apprendimento automatico, all'analisi dei dati, al data mining e alla visualizzazione dei dati


6
Classificazione statistica del testo
Sono un programmatore senza background statistico e attualmente sto esaminando diversi metodi di classificazione per un gran numero di documenti diversi che voglio classificare in categorie predefinite. Ho letto di kNN, SVM e NN. Tuttavia, ho qualche problema ad iniziare. Quali risorse mi consigliate? Conosco abbastanza bene il calcolo a …




2
Funzione di costo nella regressione lineare OLS
Sono un po 'confuso con una lezione sulla regressione lineare tenuta da Andrew Ng su Coursera sull'apprendimento automatico. Lì, ha dato una funzione di costo che minimizza la somma dei quadrati come: 12m∑i=1m(hθ(X(i))−Y(i))212m∑i=1m(hθ(X(i))−Y(i))2 \frac{1}{2m} \sum _{i=1}^m \left(h_\theta(X^{(i)})-Y^{(i)}\right)^2 Capisco da dove viene il . Penso che l'abbia fatto in modo che …



4
Come calcolare l'errore relativo quando il valore vero è zero?
Come posso calcolare l'errore relativo quando il valore vero è zero? Supponiamo che io abbia e . Se definisco l'errore relativo come:xtrue=0xtrue=0x_{true} = 0xtestxtestx_{test} relative error=xtrue−xtestxtruerelative error=xtrue−xtestxtrue\text{relative error} = \frac{x_{true}-x_{test}}{x_{true}} Quindi l'errore relativo è sempre indefinito. Se invece uso la definizione: relative error=xtrue−xtestxtestrelative error=xtrue−xtestxtest\text{relative error} = \frac{x_{true}-x_{test}}{x_{test}} Quindi l'errore relativo …




3
In che modo R gestisce i valori mancanti in lm?
Vorrei regredire un vettore B contro ciascuna delle colonne in una matrice A. Questo è banale se non ci sono dati mancanti, ma se la matrice A contiene valori mancanti, la mia regressione contro A è limitata per includere solo le righe in cui tutti sono presenti valori (il comportamento …

4
Come posso adattare un modello multilivello per risultati di dispersione eccessivamente dispersi?
Voglio montare un GLMM multilivello con una distribuzione di Poisson (con sovra dispersione) usando R. Al momento sto usando lme4 ma ho notato che recentemente la quasipoissonfamiglia è stata rimossa. Ho visto altrove che è possibile modellare l'eccessiva dispersione additiva per le distribuzioni binomiali aggiungendo un'intercettazione casuale con un livello …


Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.