Statistiche e Big Data hypothesis-testing

2

Perché è sbagliato interrompere un test A / B prima che venga raggiunta la dimensione ottimale del campione?

Sono incaricato di presentare i risultati dei test A / B (eseguiti su varianti di siti Web) presso la mia azienda. Eseguiamo il test per un mese e quindi controlliamo i valori p a intervalli regolari fino a raggiungere la significatività (o abbandoniamo se la significatività non viene raggiunta dopo …

13 hypothesis-testing statistical-significance bias ab-test optimal-stopping

8

Test di algoritmi di generazione di variabili casuali

Quali metodi vengono utilizzati per testare algoritmi di generazione di variabili casuali?

12 algorithms hypothesis-testing random-variable random-generation

3

Perché diversi test di ipotesi parametrica (se non tutti) presuppongono un campionamento casuale?

Test come Z, t e molti altri presuppongono che i dati siano basati su un campionamento casuale. Perché? Supponiamo che stia facendo ricerche sperimentali, dove mi preoccupo molto più della validità interna che di quella esterna. Quindi, se il mio campione potrebbe essere un po 'distorto, va bene, dato che …

12 hypothesis-testing sampling parametric randomness

5

Determinare la dimensione del campione prima di iniziare un esperimento o eseguire l'esperimento indefinitamente?

Ho studiato statistica anni fa e ho dimenticato tutto, quindi possono sembrare domande concettuali generali piuttosto che qualcosa di specifico, ma ecco il mio problema. Lavoro per un sito di e-commerce come UX Designer. Abbiamo un framework di test A / B che è stato costruito anni fa di cui …

12 hypothesis-testing sample-size sequential-analysis

2

Come giustificare rigorosamente i tassi di errore falsi positivi / falsi negativi scelti e il rapporto di costo sottostante?

Contesto Un gruppo di scienziati e statistici sociali ( Benjamin et al., 2017 ) ha recentemente suggerito che il tipico tasso di falsi positivi ( = .05) usato come soglia per determinare "significatività statistica" deve essere adeguato a una soglia più conservativa ( = .005). Un gruppo in competizione di …

12 hypothesis-testing p-value power type-i-and-ii-errors

2

Le competizioni di Kaggle sono state vinte per caso?

Le competizioni Kaggle determinano le classifiche finali in base a un set di prove disputato. Un set di test tenuto fuori è un campione; potrebbe non essere rappresentativo della popolazione modellata. Dato che ogni invio è come un'ipotesi, l'algoritmo che ha vinto la competizione potrebbe, per caso, aver finito per …

12 machine-learning probability hypothesis-testing sample kaggle

1

Utilizzare

Supponiamo di avere sono iid e voglio fare un test di ipotesi che μ sia 0. Supponiamo di avere n grande e di poter usare il Teorema del limite centrale. Potrei anche fare un test che μ 2 è 0, che dovrebbe essere equivalente al test che μ è 0. …

12 hypothesis-testing convergence delta-method

2

Usando lm per il test della proporzione di 2 campioni

Ho usato modelli lineari per eseguire test di proporzione a 2 campioni per un po ', ma ho capito che potrebbe non essere del tutto corretto. Sembra che l'uso di un modello lineare generalizzato con un collegamento binomiale + identità identifichi esattamente i risultati del test della proporzione di 2 …

12 r hypothesis-testing generalized-linear-model proportion

1

Test di bontà di adattamento nella regressione logistica; quale 'misura' vogliamo testare?

Mi riferisco alla domanda e alle sue risposte: come confrontare l'abilità di previsione (probabilità) dei modelli sviluppati dalla regressione logistica? di @Clark Chong e risposte / commenti di @Frank Harrell. e alla domanda Gradi di libertà di nel test di Hosmer-Lemeshowχ2χ2\chi^2 e commenti. Ho letto l'articolo DW Hosmer, T. Hosmer, …

12 hypothesis-testing logistic predictive-models regression-strategies hosmer-lemeshow-test

1

Qual è la differenza tra "verifica delle ipotesi" e "selezione del modello"?

In letteratura, entrambi i termini sono spesso usati come sinonimi o intrecciati. Ora sto cercando di trovare una chiara distinzione tra entrambi i termini. Dal mio punto di vista, un'ipotesi viene solitamente espressa attraverso un modello. Quindi, anche se testiamo un'ipotesi nulla vs. alternativa, dal mio punto di vista stiamo …

12 hypothesis-testing model-selection regression-strategies

5

Come eseguire l'imputazione dei valori in un numero molto elevato di punti dati?

Ho un set di dati molto grande e mancano circa il 5% di valori casuali. Queste variabili sono correlate tra loro. Il seguente set di dati R è solo un esempio di giocattolo con dati correlati fittizi. set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000, replace = TRUE), …

12 r random-forest missing-data data-imputation multiple-imputation large-data definition moving-window self-study categorical-data econometrics standard-error regression-coefficients normal-distribution pdf lognormal regression python scikit-learn interpolation r self-study poisson-distribution chi-squared matlab matrix r modeling multinomial mlogit choice monte-carlo indicator-function r aic garch likelihood r regression repeated-measures simulation multilevel-analysis chi-squared expected-value multinomial yates-correction classification regression self-study repeated-measures references residuals confidence-interval bootstrap normality-assumption resampling entropy cauchy clustering k-means r clustering categorical-data continuous-data r hypothesis-testing nonparametric probability bayesian pdf distributions exponential repeated-measures random-effects-model non-independent regression error regression-to-the-mean correlation group-differences post-hoc neural-networks r time-series t-test p-value normalization probability moments mgf time-series model seasonality r anova generalized-linear-model proportion percentage nonparametric ranks weighted-regression variogram classification neural-networks fuzzy variance dimensionality-reduction confidence-interval proportion z-test r self-study pdf

2

Perché questa distribuzione è uniforme?

Stiamo studiando i test statistici bayesiani e ci imbattiamo in uno strano fenomeno (per me almeno). Considera il seguente caso: siamo interessati a misurare quale popolazione, A o B, ha un tasso di conversione più elevato. Per un controllo di , , ovvero la probabilità di conversione è uguale in …

12 hypothesis-testing bayesian binomial python beta-distribution

1

Come eseguire un test bootstrap per confrontare le medie di due campioni?

Ho due campioni fortemente distorti e sto cercando di usare il bootstrap per confrontare i loro mezzi usando la statistica t. Qual è la procedura corretta per farlo? Il processo che sto usando Sono preoccupato per l'adeguatezza dell'uso dell'errore standard dei dati originali / osservati nella fase finale quando so …

12 hypothesis-testing t-test bootstrap

1

Se la distribuzione della statistica del test è bimodale, il valore p significa qualcosa?

Il valore P è definito la probabilità di ottenere una statistica test almeno estrema quanto ciò che si osserva, assumendo che l'ipotesi nulla sia vera. In altre parole, Ma cosa succede se la statistica test è distribuzione bimodale? p-value significa qualcosa in questo contesto? Ad esempio, ho intenzione di simulare …

12 hypothesis-testing statistical-significance p-value descriptive-statistics bimodal

1

Perché il test F nei modelli lineari gaussiani è più potente?

Per un modello lineare gaussiano Y=μ+σGY=μ+σGY=\mu+\sigma Gμμ\muWWWGGGRnRn\mathbb{R}^nFFFH0:{μ∈U}H0:{μ∈U}H_0\colon\{\mu \in U\}U⊂WU⊂WU \subset Wf=ϕ(2logsupμ∈W,σ>0L(μ,σ|y)supμ∈U,σ>0L(μ,σ|y)).f=ϕ(2log⁡supμ∈W,σ>0L(μ,σ|y)supμ∈U,σ>0L(μ,σ|y)).f=\phi\left( 2\log \frac{\sup_{\mu \in W, \sigma>0} L(\mu, \sigma | y)}{\sup_{\mu \in U, \sigma>0} L(\mu, \sigma | y)} \right). Come possiamo sapere che questa statistica fornisce il test più potente per (forse dopo aver scartato casi particolari insoliti)? Ciò non deriva …

12 hypothesis-testing normal-distribution linear-model power likelihood-ratio

Domande taggate «hypothesis-testing»