Domande e risposte per le persone interessate alle statistiche, all'apprendimento automatico, all'analisi dei dati, al data mining e alla visualizzazione dei dati
Come tutti sappiamo, ci sono 2 metodi per valutare il modello di regressione logistica e stanno testando cose molto diverse Potenza predittiva: Ottieni una statistica che misura la capacità di prevedere la variabile dipendente in base alle variabili indipendenti. I noti Pseudo R ^ 2 sono McFadden (1974) e Cox …
ANOVA vs regressione lineare multipla? Comprendo che entrambi questi metodi sembrano utilizzare lo stesso modello statistico. Tuttavia, in quali circostanze dovrei usare quale metodo? Quali sono i vantaggi e gli svantaggi di questi metodi rispetto? Perché l'ANOVA è così comunemente usato negli studi sperimentali e non trovo quasi mai uno …
Sappiamo che dobbiamo applicare correzioni tipo Benjamini Hochberg per test di ipotesi multiple su esperimenti basati su un singolo set di dati, al fine di controllare il tasso di scoperta falsa, altrimenti tutti gli esperimenti che danno un risultato positivo potrebbero essere falsi. Ma perché non applichiamo questo stesso principio …
\newcommand{\P}{\mathbb{P}} Abbiamo un processo casuale che può-o-può-non si verificano più volte in un determinato periodo di tempo TTT . Abbiamo un feed di dati da un modello preesistente di questo processo, che fornisce la probabilità che si verifichino numerosi eventi nel periodo 0≤t<T0≤t<T0 \leq t < T . Questo modello …
Per quanto riguarda la mia aggregati (e scarse) conoscenze sulle statistiche permessi, ho capito che se X1,X2,...,XnX1,X2,...,XnX_1, X_2,..., X_n sono variabili casuali, quindi come implica il termine sono indipendenti e identicamente distribuite. La mia preoccupazione qui è l'ex di proprietà di campioni iid, in cui si legge: p(Xn|Xi1,Xi2,...,Xik)=p(Xn),p(Xn|Xi1,Xi2,...,Xik)=p(Xn),p(X_{n}|X_{i_1},X_{i_2},...,X_{i_k}) = p(X_{n}), …
Un approccio comune alla classificazione del testo è quello di formare un classificatore fuori da un "bag-of-word". L'utente prende il testo per essere classificato e conta le frequenze delle parole in ciascun oggetto, seguito da una sorta di taglio per mantenere la matrice risultante di dimensioni gestibili. Vedo spesso che …
So che la mia domanda / titolo non è molto specifica, quindi cercherò di chiarirla: Le reti neurali artificiali hanno progetti relativamente rigidi. Naturalmente, generalmente, sono influenzati dalla biologia e cercano di costruire un modello matematico di reti neurali reali, ma la nostra comprensione delle reti neurali reali non è …
L'apprendimento automatico (ML) utilizza fortemente le tecniche di regressione lineare e logistica. Essa si basa anche su tecniche di ingegneria funzione ( feature transform, kernel, ecc). Perché non si parla di variable transformation(ad esempio power transformation) in ML? (Ad esempio, non ho mai sentito parlare di root o log su …
Dati punti dati, ognuno con caratteristiche, sono etichettati come , l'altro sono etichettati come . Ogni caratteristica prende un valore da modo casuale (distribuzione uniforme). Qual è la probabilità che esista un iperpiano che può dividere le due classi?nnndddn / 2n/2n/2000n / 2n/2n/2111[ 0 , 1 ][0,1][0,1] Consideriamo prima il …
Attualmente sto usando AnomalyDetection di Twitter in R: https://github.com/twitter/AnomalyDetection . Questo algoritmo fornisce il rilevamento delle anomalie delle serie temporali per i dati con stagionalità. Domanda: ci sono altri algoritmi simili a questo (il controllo della stagionalità non ha importanza)? Sto cercando di assegnare il maggior numero possibile di algoritmi …
Sono disponibili diversi software di implementazione per il lazo . So molto discusso sull'approccio bayesiano contro l'approccio frequentista in diversi forum. La mia domanda è molto specifica per il lazo: quali sono le differenze o i vantaggi del lazo baaysiano rispetto al lazo normale ? Ecco due esempi di implementazione …
Sono interessato al significato geometrico della correlazione multipla e del coefficiente di determinazione nella regressione o in notazione vettoriale,RRRR2R2R^2yi=β1+β2x2,i+⋯+βkxk,i+ϵiyi=β1+β2x2,i+⋯+βkxk,i+ϵiy_i = \beta_1 + \beta_2 x_{2,i} + \dots + \beta_k x_{k,i} + \epsilon_i y=Xβ+ϵy=Xβ+ϵ\mathbf{y} = \mathbf{X \beta} + \mathbf{\epsilon} Qui la matrice di progettazione XX\mathbf{X} ha nnn righe e kkk colonne, di …
Quindi questa domanda è leggermente disordinata, ma includerò grafici colorati per compensare quello! Prima lo sfondo e poi le domande. sfondo Supponi di avere una distribuzione multinomiale dimensionale con probabilità uguali sulle categorie. Sia i conteggi normalizzati ( ) di quella distribuzione, ovvero:n nnn nnπ = ( π 1 , …
Ho 50.000 immagini come queste due: Rappresentano grafici di dati. Volevo estrarre funzionalità da queste immagini, quindi ho usato il codice di autoencoder fornito da Theano (deeplearning.net). Il problema è che questi codificatori automatici non sembrano apprendere alcuna funzionalità. Ho provato RBM ed è lo stesso. Il set di dati …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.