Statistiche e Big Data

Domande e risposte per le persone interessate alle statistiche, all'apprendimento automatico, all'analisi dei dati, al data mining e alla visualizzazione dei dati


2
Test del rapporto di verosimiglianza in R
Supponiamo che farò una regressione logistica univariata su diverse variabili indipendenti, come questa: mod.a <- glm(x ~ a, data=z, family=binominal("logistic")) mod.b <- glm(x ~ b, data=z, family=binominal("logistic")) Ho fatto un confronto tra i modelli (test del rapporto di verosimiglianza) per vedere se il modello è migliore del modello null con …
25 r  logistic  diagnostic 



4
Intervista ad Amoeba
Mi è stata posta questa domanda durante un'intervista per una posizione commerciale con una società commerciale proprietaria. Mi piacerebbe molto conoscere la risposta a questa domanda e l'intuizione alla base. Domanda dell'ameba: una popolazione di amebe inizia con 1. Dopo 1 periodo in cui l'ameba può dividersi in 1, 2, …



2
Come affrontare l'analisi esplorativa dei dati e il dragaggio dei dati negli studi su piccoli campioni?
L'analisi dei dati esplorativi (EDA) spesso porta ad esplorare altre "tracce" che non appartengono necessariamente alla serie iniziale di ipotesi. Devo affrontare una situazione del genere nel caso di studi con una dimensione del campione limitata e molti dati raccolti attraverso diversi questionari (dati socio-demografici, scale neuropsicologiche o mediche - …

3
Gradiente di perdita della cerniera
Sto cercando di implementare la discesa gradiente di base e la sto testando con una funzione di perdita della cerniera, ad esempio . Tuttavia, sono confuso sul gradiente della perdita della cerniera. Ho l'impressione che lo sialhinge=max(0,1−y x⋅w)lhinge=max(0,1−y x⋅w)l_{\text{hinge}} = \max(0,1-y\ \boldsymbol{x}\cdot\boldsymbol{w}) ∂∂wlcerniera= { - y X0se y x ⋅ …

7
Qual è la differenza tra una probabilità e una proporzione?
Supponiamo che abbia mangiato hamburger ogni martedì per anni. Si potrebbe dire che mangio hamburger il 14% delle volte, o che la probabilità che io mangi un hamburger in una determinata settimana è del 14%. Quali sono le principali differenze tra probabilità e proporzioni? Una probabilità è una proporzione prevista? …

3
Applicazione di wavelet agli algoritmi di rilevazione delle anomalie basati su serie temporali
Ho iniziato a lavorare attraverso i tutorial statistici sull'estrazione dei dati di Andrew Moore (altamente raccomandato a chiunque si avventura per la prima volta in questo campo). Ho iniziato leggendo questo PDF estremamente interessante intitolato "Panoramica introduttiva degli algoritmi di rilevamento delle anomalie basati su serie temporali" in cui Moore …

5
Cerco un certo tipo di spiegazione ARIMA
Questo può essere difficile da trovare, ma mi piacerebbe leggere un ben spiegato ARIMA esempio che usa matematica minima estende la discussione oltre la costruzione di un modello nell'uso di quel modello per prevedere casi specifici utilizza sia la grafica che i risultati numerici per caratterizzare l'adattamento tra i valori …



6
Per problemi convessi, il gradiente in Discesa gradiente stocastica (SGD) indica sempre il valore estremo globale?
Data una funzione di costo convesso, usando SGD per l'ottimizzazione, avremo un gradiente (vettore) ad un certo punto durante il processo di ottimizzazione. La mia domanda è, dato il punto sul convesso, il gradiente punta solo nella direzione in cui la funzione aumenta / diminuisce più velocemente, oppure il gradiente …

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.