Domande e risposte per le persone interessate alle statistiche, all'apprendimento automatico, all'analisi dei dati, al data mining e alla visualizzazione dei dati
Sono un programmatore senza background statistico e attualmente sto esaminando diversi metodi di classificazione per un gran numero di documenti diversi che voglio classificare in categorie predefinite. Ho letto di kNN, SVM e NN. Tuttavia, ho qualche problema ad iniziare. Quali risorse mi consigliate? Conosco abbastanza bene il calcolo a …
C'è una persona dietro una tenda - non so se la persona sia femmina o maschio. So che la persona ha i capelli lunghi e che il 90% di tutte le persone con i capelli lunghi sono donne So che la persona ha un raro gruppo sanguigno AX3 e che …
I computer sono stati a lungo in grado di giocare a scacchi usando una tecnica a "forza bruta", cercando una certa profondità e quindi valutando la posizione. Il computer AlphaGo tuttavia utilizza solo una ANN per valutare le posizioni (non fa alcuna ricerca approfondita per quanto ne so). È possibile …
Contesto : desidero classificare le aree residenziali di una città in gruppi in base alle loro caratteristiche socio-economiche, tra cui densità dell'unità abitativa, densità della popolazione, area verde, prezzo delle abitazioni, numero di scuole / centri sanitari / centri diurni, ecc. Voglio capire in quanti gruppi diversi possono essere suddivise …
Sono un po 'confuso con una lezione sulla regressione lineare tenuta da Andrew Ng su Coursera sull'apprendimento automatico. Lì, ha dato una funzione di costo che minimizza la somma dei quadrati come: 12m∑i=1m(hθ(X(i))−Y(i))212m∑i=1m(hθ(X(i))−Y(i))2 \frac{1}{2m} \sum _{i=1}^m \left(h_\theta(X^{(i)})-Y^{(i)}\right)^2 Capisco da dove viene il . Penso che l'abbia fatto in modo che …
Sto usando SVM per la classificazione e sto cercando di determinare i parametri ottimali per i kernel lineari e RBF. Per il kernel lineare utilizzo la selezione dei parametri convalidata per determinare C e per il kernel RBF utilizzo la ricerca della griglia per determinare C e gamma. Ho 20 …
Nell'analisi dei componenti principali (PCA), si può scegliere la matrice di covarianza o la matrice di correlazione per trovare i componenti (dai rispettivi autovettori). Questi danno risultati diversi (caricamenti e punteggi del PC), poiché gli autovettori tra le due matrici non sono uguali. La mia comprensione è che ciò è …
Come posso calcolare l'errore relativo quando il valore vero è zero? Supponiamo che io abbia e . Se definisco l'errore relativo come:xtrue=0xtrue=0x_{true} = 0xtestxtestx_{test} relative error=xtrue−xtestxtruerelative error=xtrue−xtestxtrue\text{relative error} = \frac{x_{true}-x_{test}}{x_{true}} Quindi l'errore relativo è sempre indefinito. Se invece uso la definizione: relative error=xtrue−xtestxtestrelative error=xtrue−xtestxtest\text{relative error} = \frac{x_{true}-x_{test}}{x_{test}} Quindi l'errore relativo …
Ho trovato Project Euler http://projecteuler.net/ incredibilmente utile nell'apprendimento dei linguaggi di programmazione. Esiste un sito simile per l'apprendimento automatico? Ho visto http://www.kaggle.com/ , ma non è così accessibile ai principianti come Project Euler.
L'algoritmo PCA può essere formulato in termini di matrice di correlazione (supponiamo che i dati XXX già stati normalizzati e stiamo considerando solo la proiezione sul primo PC). La funzione obiettivo può essere scritta come: maxw( Xw )T( Xw )stwTw = 1.maxw(Xw)T(Xw)stwTw=1. \max_w (Xw)^T(Xw)\; \: \text{s.t.} \: \:w^Tw = 1. …
Qual è la formula per la varianza del prodotto delle variabili dipendenti? Nel caso di variabili indipendenti la formula è semplice: v a r (XY) = E( X2Y2) - E( XY)2= v a r ( X) v a r ( Y) + v a r ( X) E( Y)2+ v …
Vorrei regredire un vettore B contro ciascuna delle colonne in una matrice A. Questo è banale se non ci sono dati mancanti, ma se la matrice A contiene valori mancanti, la mia regressione contro A è limitata per includere solo le righe in cui tutti sono presenti valori (il comportamento …
Voglio montare un GLMM multilivello con una distribuzione di Poisson (con sovra dispersione) usando R. Al momento sto usando lme4 ma ho notato che recentemente la quasipoissonfamiglia è stata rimossa. Ho visto altrove che è possibile modellare l'eccessiva dispersione additiva per le distribuzioni binomiali aggiungendo un'intercettazione casuale con un livello …
Ho trovato un'ampia letteratura che propone tutti i tipi di criteri (ad esempio Glenn et al. 1985 (pdf) e Jung et al. 2002 (pdf)). Tuttavia, la maggior parte di questi non è così facile da implementare (almeno dal mio punto di vista). Sto usando scipy.cluster.hierarchy per ottenere una gerarchia di …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.