Statistiche e Big Data

5

Quanto è piccola una quantità da aggiungere a x per evitare di prendere il registro di zero?

Ho analizzato i miei dati così come sono. Ora voglio guardare le mie analisi dopo aver preso il registro di tutte le variabili. Molte variabili contengono molti zeri. Pertanto aggiungo una piccola quantità per evitare di prendere il registro di zero. Finora ho aggiunto 10 ^ -10, senza alcuna motivazione, …

57 data-transformation chemometrics

17

Ricettario / scheda di riferimento / cheatsheet di apprendimento automatico?

Trovo incredibilmente utili risorse come il ricettario di probabilità e statistica e la scheda di riferimento R per il data mining . Ovviamente servono anche come riferimenti, ma mi aiutano anche a organizzare i miei pensieri su un argomento e ottenere la disposizione della terra. D: Esiste qualcosa come queste …

57 machine-learning references

8

Ha mai senso trattare i dati categorici come continui?

Nel rispondere a questa domanda su dati discreti e continui ho asserito con disinvoltura che raramente ha senso trattare i dati categorici come continui. A prima vista sembra evidente, ma l'intuizione è spesso una cattiva guida per le statistiche, o almeno lo è la mia. Quindi ora mi chiedo: è …

57 categorical-data data-transformation ordinal-data continuous-data

2

Regressione di Bayes: come si fa rispetto alla regressione standard?

Ho alcune domande sulla regressione bayesiana: Data una regressione standard come . Se voglio trasformarlo in una regressione bayesiana, ho bisogno di distribuzioni precedenti sia per che (o non funziona in questo modo)?β 0 β 1y= β0+ β1x + εy=β0+β1x+εy = \beta_0 + \beta_1 x + \varepsilonβ0β0\beta_0β1β1\beta_1 Nella regressione standard …

57 regression bayesian

3

Quando sono appropriate le scale del registro?

Ho letto che l'uso di scale di log quando la creazione di grafici / grafici è appropriato in determinate circostanze, come l'asse y in un grafico di serie temporali. Tuttavia, non sono stato in grado di trovare una spiegazione definitiva sul perché sia così o quando altrimenti sarebbe appropriato. Tieni …

57 data-visualization data-transformation

3

Le variabili sono spesso regolate (ad esempio standardizzate) prima di creare un modello: quando è una buona idea e quando è cattiva?

In quali circostanze vorresti o non vuoi ridimensionare o standardizzare una variabile prima del fitting del modello? E quali sono i vantaggi / gli svantaggi del ridimensionamento di una variabile?

57 modeling predictive-models feature-selection theory standardization

3

Perché la deviazione standard del campione è uno stimatore distorto di

Secondo l'articolo di Wikipedia sulla stima imparziale della deviazione standard il campione SD s=1n−1∑i=1n(xi−x¯¯¯)2−−−−−−−−−−−−−−−√s=1n−1∑i=1n(xi−x¯)2s = \sqrt{\frac{1}{n-1} \sum_{i=1}^n (x_i - \overline{x})^2} è uno stimatore distorto della DS della popolazione. Indica che .E(s2−−√)≠E(s2)−−−−−√E(s2)≠E(s2)E(\sqrt{s^2}) \neq \sqrt{E(s^2)} NB. Le variabili casuali sono indipendenti e ognixi∼N(μ,σ2)xi∼N(μ,σ2)x_{i} \sim N(\mu,\sigma^{2}) La mia domanda è duplice: Qual è …

57 estimation standard-deviation

9

È sbagliato riformulare "1 decesso su 80 è causato da un incidente d'auto" poiché "1 persona su 80 muore a causa di un incidente d'auto?"

Dichiarazione 1 (S1): "Una morte su 80 è causata da un incidente d'auto". Dichiarazione due (S2): "Una persona su 80 muore a causa di un incidente d'auto". Ora, personalmente non vedo molta differenza tra queste due affermazioni. Quando scrivo, li considererei intercambiabili con un pubblico laico. Tuttavia, ora sono stato …

56 interpretation risk

7

Sfide tra industria e Kaggle. Raccogliere più osservazioni e avere accesso a più variabili è più importante della modellazione fantasia?

Spero che il titolo sia autoesplicativo. In Kaggle, la maggior parte dei vincitori usa lo stacking con a volte centinaia di modelli base, per spremere un po 'di% in più di MSE, precisione ... In generale, nella tua esperienza, quanto è importante la modellazione fantasia come lo stacking rispetto alla …

56 large-data stacking collecting-data kaggle

4

Quali sono le differenze tra PCA e autoencoder?

Sia PCA che autoencoder possono ridurre la demensione, quindi quali sono le differenze? In quale situazione dovrei usare l'uno sull'altro?

56 machine-learning pca neural-networks autoencoders

6

La regolarizzazione L2 equivale al priore gaussiano

Continuo a leggere questo e intuitivamente posso vederlo, ma come si passa dalla regolarizzazione L2 a dire che si tratta analiticamente di un priore gaussiano? Lo stesso vale per dire che L1 equivale a un precedente lappone. Ogni ulteriore riferimento sarebbe fantastico.

56 regression references regularization

1

La regressione logistica in R ha provocato una separazione perfetta (fenomeno di Hauck-Donner). E adesso?

Sto cercando di prevedere un risultato binario usando 50 variabili esplicative continue (l'intervallo della maggior parte delle variabili va da a ∞ ). Il mio set di dati ha quasi 24.000 righe. Quando corro in R, ottengo:−∞−∞-\infty∞∞\inftyglm Warning messages: 1: glm.fit: algorithm did not converge 2: glm.fit: fitted probabilities numerically …

56 r regression logistic separation

8

Librerie R per l'apprendimento profondo

Mi chiedevo se ci sono buone librerie R là fuori per le reti neurali di apprendimento profondo? So che c'è il nnet, neuralnete RSNNS, ma nessuno di questi sembra implementare metodi di apprendimento profondo. Sono particolarmente interessato a un apprendimento non supervisionato seguito da un apprendimento supervisionato e all'utilizzo del …

56 r neural-networks deep-learning rbm deep-belief-networks

4

Tutti i valori all'interno di un intervallo di confidenza del 95% sono ugualmente probabili?

Ho trovato informazioni discordanti sulla domanda: " Se si costruisce un intervallo di confidenza (CI) del 95% di una differenza nelle medie o una differenza nelle proporzioni, tutti i valori all'interno dell'IC sono ugualmente probabili? Oppure, la stima puntuale è la più probabile , con valori vicini alle "code" dell'IC …

56 confidence-interval

6

L '"ibrido" tra l'approccio Fisher e Neyman-Pearson ai test statistici è davvero un "miscuglio incoerente"?

Esiste una certa scuola di pensiero secondo la quale l'approccio più diffuso ai test statistici è un "ibrido" tra due approcci: quello di Fisher e quello di Neyman-Pearson; questi due approcci, afferma la rivendicazione, sono "incompatibili" e quindi il "ibrido" risultante è un "miscuglio incoerente". Fornirò una bibliografia e alcune …

56 hypothesis-testing statistical-significance p-value type-i-and-ii-errors history