Sono incaricato di presentare i risultati dei test A / B (eseguiti su varianti di siti Web) presso la mia azienda. Eseguiamo il test per un mese e quindi controlliamo i valori p a intervalli regolari fino a raggiungere la significatività (o abbandoniamo se la significatività non viene raggiunta dopo …
Test come Z, t e molti altri presuppongono che i dati siano basati su un campionamento casuale. Perché? Supponiamo che stia facendo ricerche sperimentali, dove mi preoccupo molto più della validità interna che di quella esterna. Quindi, se il mio campione potrebbe essere un po 'distorto, va bene, dato che …
Ho studiato statistica anni fa e ho dimenticato tutto, quindi possono sembrare domande concettuali generali piuttosto che qualcosa di specifico, ma ecco il mio problema. Lavoro per un sito di e-commerce come UX Designer. Abbiamo un framework di test A / B che è stato costruito anni fa di cui …
Contesto Un gruppo di scienziati e statistici sociali ( Benjamin et al., 2017 ) ha recentemente suggerito che il tipico tasso di falsi positivi ( = .05) usato come soglia per determinare "significatività statistica" deve essere adeguato a una soglia più conservativa ( = .005). Un gruppo in competizione di …
Le competizioni Kaggle determinano le classifiche finali in base a un set di prove disputato. Un set di test tenuto fuori è un campione; potrebbe non essere rappresentativo della popolazione modellata. Dato che ogni invio è come un'ipotesi, l'algoritmo che ha vinto la competizione potrebbe, per caso, aver finito per …
Supponiamo di avere sono iid e voglio fare un test di ipotesi che μ sia 0. Supponiamo di avere n grande e di poter usare il Teorema del limite centrale. Potrei anche fare un test che μ 2 è 0, che dovrebbe essere equivalente al test che μ è 0. …
Ho usato modelli lineari per eseguire test di proporzione a 2 campioni per un po ', ma ho capito che potrebbe non essere del tutto corretto. Sembra che l'uso di un modello lineare generalizzato con un collegamento binomiale + identità identifichi esattamente i risultati del test della proporzione di 2 …
Mi riferisco alla domanda e alle sue risposte: come confrontare l'abilità di previsione (probabilità) dei modelli sviluppati dalla regressione logistica? di @Clark Chong e risposte / commenti di @Frank Harrell. e alla domanda Gradi di libertà di nel test di Hosmer-Lemeshowχ2χ2\chi^2 e commenti. Ho letto l'articolo DW Hosmer, T. Hosmer, …
In letteratura, entrambi i termini sono spesso usati come sinonimi o intrecciati. Ora sto cercando di trovare una chiara distinzione tra entrambi i termini. Dal mio punto di vista, un'ipotesi viene solitamente espressa attraverso un modello. Quindi, anche se testiamo un'ipotesi nulla vs. alternativa, dal mio punto di vista stiamo …
Ho un set di dati molto grande e mancano circa il 5% di valori casuali. Queste variabili sono correlate tra loro. Il seguente set di dati R è solo un esempio di giocattolo con dati correlati fittizi. set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000, replace = TRUE), …
Stiamo studiando i test statistici bayesiani e ci imbattiamo in uno strano fenomeno (per me almeno). Considera il seguente caso: siamo interessati a misurare quale popolazione, A o B, ha un tasso di conversione più elevato. Per un controllo di , , ovvero la probabilità di conversione è uguale in …
Ho due campioni fortemente distorti e sto cercando di usare il bootstrap per confrontare i loro mezzi usando la statistica t. Qual è la procedura corretta per farlo? Il processo che sto usando Sono preoccupato per l'adeguatezza dell'uso dell'errore standard dei dati originali / osservati nella fase finale quando so …
Il valore P è definito la probabilità di ottenere una statistica test almeno estrema quanto ciò che si osserva, assumendo che l'ipotesi nulla sia vera. In altre parole, Ma cosa succede se la statistica test è distribuzione bimodale? p-value significa qualcosa in questo contesto? Ad esempio, ho intenzione di simulare …
Per un modello lineare gaussiano Y=μ+σGY=μ+σGY=\mu+\sigma Gμμ\muWWWGGGRnRn\mathbb{R}^nFFFH0:{μ∈U}H0:{μ∈U}H_0\colon\{\mu \in U\}U⊂WU⊂WU \subset Wf=ϕ(2logsupμ∈W,σ>0L(μ,σ|y)supμ∈U,σ>0L(μ,σ|y)).f=ϕ(2logsupμ∈W,σ>0L(μ,σ|y)supμ∈U,σ>0L(μ,σ|y)).f=\phi\left( 2\log \frac{\sup_{\mu \in W, \sigma>0} L(\mu, \sigma | y)}{\sup_{\mu \in U, \sigma>0} L(\mu, \sigma | y)} \right). Come possiamo sapere che questa statistica fornisce il test più potente per (forse dopo aver scartato casi particolari insoliti)? Ciò non deriva …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.