Statistiche e Big Data

Domande e risposte per le persone interessate alle statistiche, all'apprendimento automatico, all'analisi dei dati, al data mining e alla visualizzazione dei dati


4
Come interpretare un diagramma QQ
Sto lavorando con un piccolo set di dati (21 osservazioni) e ho il seguente diagramma QQ normale in R: Visto che la trama non supporta la normalità, cosa potrei dedurre sulla distribuzione sottostante? Mi sembra che una distribuzione più inclinata a destra sarebbe più adatta, giusto? Inoltre, quali altre conclusioni …

9
Perché l'improvviso fascino per i tensori?
Ho notato ultimamente che molte persone stanno sviluppando equivalenti tensoriali di molti metodi (fattorizzazione tensoriale, kernel tensoriale, tensori per la modellazione di argomenti, ecc.) Mi chiedo, perché il mondo è improvvisamente affascinato dai tensori? Ci sono documenti recenti / risultati standard che sono particolarmente sorprendenti, che hanno portato a questo? …

3
Quando dovrei usare lasso vs ridge?
Supponiamo che io voglia stimare un gran numero di parametri e voglio penalizzarne alcuni perché credo che dovrebbero avere scarso effetto rispetto agli altri. Come faccio a decidere quale schema di penalizzazione utilizzare? Quando è più appropriata la regressione della cresta? Quando dovrei usare il lazo?





3
Cheat sheet di R's lmer
Ci sono molte discussioni in corso su questo forum sul modo corretto di specificare vari modelli gerarchici usando lmer. Ho pensato che sarebbe bello avere tutte le informazioni in un unico posto. Un paio di domande per iniziare: Come specificare più livelli, in cui un gruppo è nidificato nell'altro: è …

3
ROC vs curve di precisione e richiamo
Comprendo le differenze formali tra loro, quello che voglio sapere è quando è più pertinente usare l'uno contro l'altro. Forniscono sempre informazioni complementari sulle prestazioni di un determinato sistema di classificazione / rilevamento? Quando è ragionevole fornire entrambi, per esempio, in un documento? invece di uno solo? Esistono descrittori alternativi …


2
Generativo vs. discriminativo
So che generativo significa "basato su " e discriminante "basato su ", ma sono confuso su diversi punti:P(x,y)P(x,y)P(x,y)P(y|x)P(y|x)P(y|x) Wikipedia (+ molti altri successi sul web) classificano come discriminatori SVM e alberi delle decisioni. Ma questi non hanno nemmeno interpretazioni probabilistiche. Cosa significa discriminante qui? La discriminazione è appena arrivata a …


6
Un valore di distribuzione di probabilità superiore a 1 può essere OK?
Nella pagina Wikipedia sugli ingenui classificatori Bayes , c'è questa linea: p(height|male)=1.5789p(height|male)=1.5789p(\mathrm{height}|\mathrm{male}) = 1.5789 (Una distribuzione di probabilità su 1 è OK. È l'area sotto la curva della campana che è uguale a 1.) Come può un valore essere OK? Pensavo che tutti i valori di probabilità fossero espressi nell'intervallo …


Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.