Statistiche e Big Data normality-assumption

2

Qual è la differenza tra il test di normalità di Shapiro-Wilk e il test di normalità di Kolmogorov-Smirnov?

Qual è la differenza tra il test di normalità di Shapiro-Wilk e il test di normalità di Kolmogorov-Smirnov? Quando differiranno i risultati di questi due metodi?

30 distributions statistical-significance normality-assumption kolmogorov-smirnov

5

C'è una spiegazione del perché ci sono così tanti fenomeni naturali che seguono la normale distribuzione?

Penso che questo sia un argomento affascinante e non lo capisco del tutto. Quale legge della fisica fa in modo che così tanti fenomeni naturali abbiano una distribuzione normale? Sembrerebbe più intuitivo che avrebbero una distribuzione uniforme. È così difficile per me capire questo e sento che mi mancano alcune …

29 distributions normal-distribution normality-assumption uniform

6

Interpretazione del test di Shapiro-Wilk

Sono abbastanza nuovo nelle statistiche e ho bisogno del tuo aiuto. Ho un piccolo campione, come segue: H4U 0.269 0.357 0.2 0.221 0.275 0.277 0.253 0.127 0.246 Ho eseguito il test Shapiro-Wilk usando R: shapiro.test(precisionH4U$H4U) e ho ottenuto il seguente risultato: W = 0.9502, p-value = 0.6921 Ora, se presumo …

29 r distributions interpretation goodness-of-fit normality-assumption

1

Quanto è errato un modello di regressione quando le assunzioni non sono soddisfatte?

Quando si adatta un modello di regressione, cosa succede se le ipotesi degli output non sono soddisfatte, in particolare: Cosa succede se i residui non sono omoscedastici? Se i residui mostrano uno schema crescente o decrescente nella trama Residui vs. Cosa succede se i residui non sono normalmente distribuiti e …

28 regression multiple-regression error assumptions normality-assumption

1

Ripetibilità informatica degli effetti da un modello più leggero

Mi sono appena imbattuto in questo documento , che descrive come calcolare la ripetibilità ( nota anche come affidabilità, nota anche come correlazione intraclasse) di una misurazione tramite la modellazione di effetti misti. Il codice R sarebbe: #fit the model fit = lmer(dv~(1|unit),data=my_data) #obtain the variance estimates vc = VarCorr(fit) …

28 mixed-model reliability intraclass-correlation repeatability spss factor-analysis survey modeling cross-validation error curve-fitting mediation correlation clustering sampling machine-learning probability classification metric r project-management optimization svm python dataset quality-control checking clustering distributions anova factor-analysis exponential poisson-distribution generalized-linear-model deviance machine-learning k-nearest-neighbour r hypothesis-testing t-test r variance levenes-test bayesian software bayesian-network regression repeated-measures least-squares change-scores variance chi-squared variance nonlinear-regression regression-coefficients multiple-comparisons p-value r statistical-significance excel sampling sample r distributions interpretation goodness-of-fit normality-assumption probability self-study distributions references theory time-series clustering econometrics binomial hypothesis-testing variance t-test paired-comparisons statistical-significance ab-test r references hypothesis-testing t-test normality-assumption wilcoxon-mann-whitney central-limit-theorem t-test data-visualization interactive-visualization goodness-of-fit

1

I gradi di libertà possono essere un numero non intero?

Quando uso GAM, mi dà DF residuo è (ultima riga nel codice). Cosa significa? Andando oltre l'esempio GAM, in generale, il numero di gradi di libertà può essere un numero non intero?26.626.626.6 > library(gam) > summary(gam(mpg~lo(wt),data=mtcars)) Call: gam(formula = mpg ~ lo(wt), data = mtcars) Deviance Residuals: Min 1Q Median …

27 r degrees-of-freedom gam machine-learning pca lasso probability self-study bootstrap expected-value regression machine-learning linear-model probability simulation random-generation machine-learning distributions svm libsvm classification pca multivariate-analysis feature-selection archaeology r regression dataset simulation r regression time-series forecasting predictive-models r mean sem lavaan machine-learning regularization regression conv-neural-network convolution classification deep-learning conv-neural-network regression categorical-data econometrics r confirmatory-factor scale-invariance self-study unbiased-estimator mse regression residuals sampling random-variable sample probability random-variable convergence r survival weibull references autocorrelation hypothesis-testing distributions correlation regression statistical-significance regression-coefficients univariate categorical-data chi-squared regression machine-learning multiple-regression categorical-data linear-model pca factor-analysis factor-rotation classification scikit-learn logistic p-value regression panel-data multilevel-analysis variance bootstrap bias probability r distributions interquartile time-series hypothesis-testing normal-distribution normality-assumption kurtosis arima panel-data stata clustered-standard-errors machine-learning optimization lasso multivariate-analysis ancova machine-learning cross-validation

3

Cosa devo verificare per la normalità: dati grezzi o residui?

Ho imparato che devo verificare la normalità non sui dati grezzi ma sui loro residui. Devo calcolare i residui e quindi eseguire il test W di Shapiro-Wilk? I residui sono calcolati come: ?Xio- mediaXi−meanX_i - \text{mean} Si prega di consultare questa domanda precedente per i miei dati e il design.

27 normality-assumption residuals assumptions

3

È significativo testare la normalità con una dimensione del campione molto piccola (ad esempio, n = 6)?

Ho una dimensione del campione di 6. In tal caso, ha senso testare la normalità usando il test di Kolmogorov-Smirnov? Ho usato SPSS. Ho una dimensione del campione molto piccola perché ci vuole tempo per ottenerne ciascuno. Se non ha senso, quanti campioni è il numero più basso che ha …

26 hypothesis-testing normality-assumption kolmogorov-smirnov power

4

Shapiro-Wilk è il miglior test di normalità? Perché potrebbe essere migliore di altri test come Anderson-Darling?

Ho letto da qualche parte in letteratura che il test di Shapiro-Wilk è considerato il miglior test di normalità perché per un dato livello di significatività, , la probabilità di rifiutare l'ipotesi nulla se è falsa è più alta che nel caso dell'altra test di normalità.αα\alpha Potresti spiegarmi, usando gli …

24 hypothesis-testing normal-distribution normality-assumption

5

Quanto è solido il test t dei campioni indipendenti quando le distribuzioni dei campioni non sono normali?

Ho letto che il test t è "ragionevolmente robusto" quando le distribuzioni dei campioni si discostano dalla normalità. Naturalmente, è la distribuzione campionaria delle differenze che sono importanti. Ho dei dati per due gruppi. Uno dei gruppi è fortemente distorto sulla variabile dipendente. La dimensione del campione è piuttosto piccola …

24 t-test assumptions normality-assumption robust

5

Posso fidarmi dei risultati ANOVA per un DV non distribuito normalmente?

Ho analizzato un esperimento con ANOVA misure ripetute. L'ANOVA è un 3x2x2x2x3 con 2 fattori tra soggetti e 3 all'interno (N = 189). Il tasso di errore è la variabile dipendente. La distribuzione dei tassi di errore ha un'inclinazione di 3,64 e una curtosi di 15,75. L'inclinazione e la curtosi …

22 anova normality-assumption

9

Come faccio a capire quale tipo di distribuzione rappresenta questi dati nei tempi di risposta del ping?

Ho provato un processo del mondo reale, i tempi di ping della rete. Il "round-trip-time" è misurato in millisecondi. I risultati sono riportati in un istogramma: I tempi di ping hanno un valore minimo, ma una lunga coda superiore. Voglio sapere che cos'è la distribuzione statistica e come stimarne i …

22 distributions sample-size sample normality-assumption distribution-identification

5

Ipotesi di modelli lineari e cosa fare se i residui non sono normalmente distribuiti

Sono un po 'confuso su quali siano i presupposti della regressione lineare. Finora ho verificato se: tutte le variabili esplicative erano correlate in modo lineare con la variabile di risposta. (Questo era il caso) c'era qualche collinearità tra le variabili esplicative. (c'era poca collinearità). le distanze di Cook dei punti …

22 linear-model residuals assumptions normality-assumption

6

Test di normalità appropriati per piccoli campioni

Finora ho usato la statistica di Shapiro-Wilk per testare ipotesi di normalità in piccoli campioni. Potresti per favore consigliare un'altra tecnica?

22 hypothesis-testing goodness-of-fit normality-assumption small-sample

4

Come proiettare un nuovo vettore nello spazio PCA?

Dopo aver eseguito l'analisi dei componenti principali (PCA), voglio proiettare un nuovo vettore nello spazio PCA (ovvero trovare le sue coordinate nel sistema di coordinate PCA). Ho calcolato PCA in linguaggio R utilizzando prcomp. Ora dovrei essere in grado di moltiplicare il mio vettore per la matrice di rotazione PCA. …

21 r pca r variance heteroscedasticity misspecification distributions time-series data-visualization modeling histogram kolmogorov-smirnov negative-binomial likelihood-ratio econometrics panel-data categorical-data scales survey distributions pdf histogram correlation algorithms r gpu parallel-computing approximation mean median references sample-size normality-assumption central-limit-theorem rule-of-thumb confidence-interval estimation mixed-model psychometrics random-effects-model hypothesis-testing sample-size dataset large-data regression standard-deviation variance approximation hypothesis-testing variance central-limit-theorem kernel-trick kernel-smoothing error sampling hypothesis-testing normality-assumption philosophical confidence-interval modeling model-selection experiment-design hypothesis-testing statistical-significance power asymptotics information-retrieval anova multiple-comparisons ancova classification clustering factor-analysis psychometrics r sampling expectation-maximization markov-process r data-visualization correlation regression statistical-significance degrees-of-freedom experiment-design r regression curve-fitting change-point loess machine-learning classification self-study monte-carlo markov-process references mathematical-statistics data-visualization python cart boosting regression classification robust cart survey binomial psychometrics likert psychology asymptotics multinomial

Domande taggate «normality-assumption»