Statistiche e Big Data

Domande e risposte per le persone interessate alle statistiche, all'apprendimento automatico, all'analisi dei dati, al data mining e alla visualizzazione dei dati


3
LASSO con termini di interazione: va bene se gli effetti principali sono ridotti a zero?
La regressione di LASSO riduce i coefficienti verso zero, fornendo così un'efficace selezione del modello. Credo che nei miei dati vi siano interazioni significative tra covariate nominali e continue. Non necessariamente, tuttavia, gli "effetti principali" del modello reale sono significativi (diversi da zero). Ovviamente non lo so poiché il vero …




5
Algoritmi di machine learning per gestire i dati mancanti
Sto cercando di sviluppare un modello predittivo utilizzando dati clinici ad alta dimensione, compresi i valori di laboratorio. Lo spazio dati è scarso con 5k campioni e 200 variabili. L'idea è quella di classificare le variabili utilizzando un metodo di selezione delle funzionalità (IG, RF ecc.) E utilizzare funzionalità di …

2
Attingendo dalla distribuzione di Dirichlet
Diciamo che abbiamo una distribuzione di Dirichlet con parametro vettoriale tridimensionale . Come posso disegnare un campione (un vettore tridimensionale ) da questa distribuzione? Ho bisogno di una (forse) semplice spiegazione.KKKα⃗ =[α1,α2,...,αK]α→=[α1,α2,...,αK]\vec\alpha = [\alpha_1, \alpha_2,...,\alpha_K]KKK


2
Intuizione dietro la regressione logistica
Di recente ho iniziato a studiare l'apprendimento automatico, ma non sono riuscito a cogliere l'intuizione alla base della regressione logistica . Di seguito sono riportati i fatti sulla regressione logistica che capisco. Come base per l'ipotesi usiamo la funzione sigmoide . Capisco perché è una scelta corretta, tuttavia perché è …


3
In che modo i bayesiani confrontano le distribuzioni?
Quindi, penso di avere una buona conoscenza delle basi della probabilità frequentista e dell'analisi statistica (e di quanto male possa essere usato). In un mondo frequentista, ha senso porre una domanda come "questa distribuzione è diversa da quella distribuzione", perché si presume che le distribuzioni siano reali, oggettive e immutabili …





Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.