Statistiche e Big Data

4

Il 50% è superiore del 25% rispetto al 25% o è superiore del 25% rispetto al 25%?

Se ho due valori A e B che sono entrambi espressi come percentuale di C e voglio esprimere la differenza di grandezza tra A e B come percentuale D, è più corretto esprimere D come percentuale di C, oppure in percentuale di B (o effettivamente A)? 50 disoccupati sono ovviamente …

21 terminology percentage

1

Interpretazione variabile latente di modelli lineari generalizzati (GLM)

Versione breve: Sappiamo che la regressione logistica e la regressione probit possono essere interpretate come implicanti una variabile latente continua che viene discretizzata in base a una soglia fissa prima dell'osservazione. È disponibile una simile interpretazione variabile latente per, per esempio, la regressione di Poisson? Che ne dici della regressione …

21 logistic generalized-linear-model poisson-regression probit latent-variable

2

Il limite dello stimatore della regressione della cresta "varianza unitaria" quando

Considera la regressione della cresta con un vincolo aggiuntivo che richiede che abbia la somma unitaria dei quadrati (equivalentemente, varianza unitaria); se necessario, si può presumere che abbia anche la somma unitaria dei quadrati:y^y^\hat{\mathbf y}yy\mathbf y β^∗λ=argmin{∥y−Xβ∥2+λ∥β∥2}s.t.∥Xβ∥2=1.β^λ∗=arg⁡min{‖y−Xβ‖2+λ‖β‖2}s.t.‖Xβ‖2=1.\hat{\boldsymbol\beta}_\lambda^* = \arg\min\Big\{\|\mathbf y - \mathbf X \boldsymbol \beta\|^2+\lambda\|\boldsymbol\beta\|^2\Big\} \:\:\text{s.t.}\:\: \|\mathbf X \boldsymbol\beta\|^2=1. Qual …

21 pca regularization ridge-regression partial-least-squares constrained-regression

1

Mostrando che 100 misurazioni per 5 soggetti forniscono molte meno informazioni di 5 misurazioni per 100 soggetti

Durante una conferenza ho sentito la seguente dichiarazione: 100 misurazioni per 5 soggetti forniscono molte meno informazioni rispetto a 5 misurazioni per 100 soggetti. È abbastanza ovvio che questo è vero, ma mi chiedevo come si potesse dimostrarlo matematicamente ... Penso che si possa usare un modello misto lineare. Tuttavia, …

21 mixed-model variance repeated-measures sample-size intraclass-correlation

1

t-SNE contro MDS

Recentemente ho letto alcune domande su t-SNE ( t-Distributed Stochastic Neighbor Embedding ) e ho anche visitato alcune domande su MDS ( Multidimensional Scaling ). Sono spesso usati in modo analogo, quindi mi è sembrata una buona idea fare questa domanda visto che qui ci sono molte domande su entrambi …

21 data-visualization dimensionality-reduction multidimensional-scaling tsne

5

Cosa rende indefinita la media di alcune distribuzioni?

Molti PDF vanno da meno a infinito positivo, ma alcuni mezzi sono definiti e altri no. Quale tratto comune rende alcuni calcolabili?

21 distributions mean

7

Qualcuno può aiutare a spiegare la differenza tra indipendente e casuale?

In statistica, indipendente e casuale descrivono le stesse caratteristiche? Qual è la differenza tra loro? Spesso ci imbattiamo nella descrizione come "due variabili casuali indipendenti" o "campionamento casuale". Mi chiedo quale sia la differenza esatta tra loro. Qualcuno può spiegare questo e dare alcuni esempi? per esempio processo non indipendente …

21 distributions sampling randomness

2

Quando dovremmo discretizzare / binare variabili / caratteristiche indipendenti continue e quando no?

Quando dovremmo discretizzare / binare variabili / caratteristiche indipendenti e quando no? I miei tentativi di rispondere alla domanda: In generale, non dovremmo fare il bin, perché il binning perderà informazioni. Il binning sta effettivamente aumentando il grado di libertà del modello, quindi è possibile causare un eccesso di adattamento …

21 machine-learning continuous-data feature-construction binning

4

Gli algoritmi di Machine Learning o Deep Learning possono essere utilizzati per "migliorare" il processo di campionamento di una tecnica MCMC?

Sulla base della scarsa conoscenza che ho dei metodi MCMC (Markov chain Monte Carlo), capisco che il campionamento è una parte cruciale della tecnica di cui sopra. I metodi di campionamento più comunemente usati sono Hamiltoniano e Metropolis. Esiste un modo per utilizzare l'apprendimento automatico o anche l'apprendimento profondo per …

21 machine-learning mcmc monte-carlo markov-process

2

Macchina Boltzmann limitata: come viene utilizzata nell'apprendimento automatico?

Sfondo: Sì, è possibile utilizzare la macchina Boltzmann con restrizioni (RBM) per avviare i pesi di una rete neurale. Inoltre PUO 'essere usato in modo "strato per strato" per costruire una rete di credenze profonde (cioè per addestrare un -esimo strato sulla parte superiore di ( n - 1 ) …

21 machine-learning neural-networks deep-learning deep-belief-networks rbm

5

Overfitting: nessun proiettile d'argento?

La mia comprensione è che anche quando si seguono le corrette procedure di convalida incrociata e selezione dei modelli, si verificherà un overfitting se si cerca un modello abbastanza duramente , a meno che non si impongano restrizioni sulla complessità del modello, sul periodo. Inoltre, spesso le persone tentano di …

21 machine-learning cross-validation goodness-of-fit scikit-learn caret

4

Differenza tra i presupposti alla base di una correlazione e una pendenza test di significatività

La mia domanda è nata da una discussione con @whuber nei commenti di un'altra domanda . Nello specifico, il commento di @whuber è stato il seguente: Uno dei motivi per cui potrebbe sorprenderti è che le ipotesi alla base di un test di correlazione e di un test di pendenza …

21 regression correlation p-value assumptions

2

Promuovere le reti neurali

Di recente, stavo lavorando all'apprendimento di algoritmi di potenziamento, come adaboost, boost gradiente, e ho saputo che lo studente debole più usato è l'albero. Voglio davvero sapere ci sono alcuni esempi recenti di successo (intendo alcuni documenti o articoli) per l'utilizzo di reti neurali come studente di base.

21 neural-networks deep-learning boosting ensemble dropout

3

Perché la distribuzione logistica si chiama "logistica"?

Che cosa è "logistico" sulla distribuzione logistica, in senso comune? Qual è l'etimologia e la logica lessicale del nome, non solo la pura definizione matematica?

21 terminology history etymology logistic-curve logistic-distribution

1

Set di dati simili a Anscombe con lo stesso riquadro e trama di baffi (media / std / mediana / MAD / min / max)

EDIT: Poiché questa domanda è stata gonfiata, un riassunto: trovare diversi set di dati significativi e interpretabili con le stesse statistiche miste (media, mediana, media e le loro dispersioni associate e regressione). Il quartetto Anscombe (vedi Scopo della visualizzazione di dati ad alta dimensione? ) È un famoso esempio di …

21 regression descriptive-statistics curve-fitting estimators