Statistiche e Big Data

Domande e risposte per le persone interessate alle statistiche, all'apprendimento automatico, all'analisi dei dati, al data mining e alla visualizzazione dei dati





5
Perché l'ANOVA viene insegnato / usato come se fosse una metodologia di ricerca diversa rispetto alla regressione lineare?
ANOVA è equivalente alla regressione lineare con l'uso di variabili fittizie adatte. Le conclusioni rimangono le stesse indipendentemente dal fatto che si usi ANOVA o regressione lineare. Alla luce della loro equivalenza, c'è qualche motivo per cui viene utilizzato ANOVA invece della regressione lineare? Nota: sono particolarmente interessato a conoscere …
91 regression  anova 

11
Quando la regressione lineare dovrebbe essere chiamata "apprendimento automatico"?
In un recente colloquio, l'abstract del relatore sosteneva che stavano usando l'apprendimento automatico. Durante il discorso, l'unica cosa relativa all'apprendimento automatico era che eseguono una regressione lineare sui loro dati. Dopo aver calcolato i coefficienti di adattamento migliore nello spazio dei parametri 5D, hanno confrontato questi coefficienti in un sistema …




7
Come gestire in modo efficiente un progetto di analisi statistica?
Sentiamo spesso parlare della gestione del progetto e dei modelli di progettazione nell'informatica, ma meno frequentemente nell'analisi statistica. Tuttavia, sembra che un passo decisivo verso la progettazione di un progetto statistico efficace e duraturo sia quello di mantenere le cose organizzate. Sostengo spesso l'uso di R e un'organizzazione coerente di …

1
Interpretazione plot.lm ()
Avevo una domanda sull'interpretazione dei grafici generati dalla trama (lm) in R. Mi stavo chiedendo se potreste dirmi come interpretare i grafici della posizione in scala e della leva residua? Eventuali commenti sarebbero apprezzati. Assumi le conoscenze di base di statistica, regressione ed econometria.

4
Perché normalizzare le immagini sottraendo la media dell'immagine del set di dati, anziché la media dell'immagine attuale nell'apprendimento profondo?
Esistono alcune varianti su come normalizzare le immagini ma la maggior parte sembra utilizzare questi due metodi: Sottrai la media per canale calcolata su tutte le immagini (ad es. VGG_ILSVRC_16_layers ) Sottrai dal pixel / canale calcolato su tutte le immagini (es. CNN_S , vedi anche la rete di riferimento …

1
Effetti casuali incrociati vs nidificati: in che modo differiscono e come vengono specificati correttamente in lme4?
Ecco come ho compreso gli effetti casuali nidificati o incrociati: Gli effetti casuali nidificati si verificano quando un fattore di livello inferiore appare solo all'interno di un determinato livello di un fattore di livello superiore. Ad esempio, gli alunni delle classi in un determinato momento. In lme4ho pensato che rappresentiamo …


4
Quando utilizzare i GLM gamma?
La distribuzione gamma può assumere una gamma piuttosto ampia di forme e, dato il legame tra media e varianza attraverso i suoi due parametri, sembra adatta a trattare l'eteroschedasticità nei dati non negativi, in modo che OLS trasformato in log possa non fare a meno di WLS o di una …

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.