Sono interessato alla seguente versione unilaterale di Cantelli della disuguaglianza di Chebyshev : P(X−E(X)≥t)≤Var(X)Var(X)+t2.P(X−E(X)≥t)≤Var(X)Var(X)+t2. \mathbb P(X - \mathbb E (X) \geq t) \leq \frac{\mathrm{Var}(X)}{\mathrm{Var}(X) + t^2} \,. Fondamentalmente, se conosci la media e la varianza della popolazione, puoi calcolare il limite superiore sulla probabilità di osservare un certo valore. (Questa …
Winsorizing data significa sostituire i valori estremi di un set di dati con un certo valore percentile da ciascuna estremità, mentre il Trimming o Truncating comporta la rimozione di quei valori estremi. Vedo sempre entrambi i metodi discussi come un'opzione praticabile per ridurre l'effetto dei valori anomali quando si calcolano …
Questa domanda è stata posta dal mio amico che non è esperto di Internet. Non ho un background statistico e ho cercato su Internet questa domanda. La domanda è: è possibile sostituire i valori anomali con un valore medio? se è possibile, ci sono riferimenti / riviste di libri per …
Wikipedia spiega: Per un set di dati, la media è la somma dei valori divisa per il numero di valori. Questa definizione corrisponde tuttavia a ciò che chiamo "medio" (almeno è quello che ricordo di aver appreso). Eppure Wikipedia cita ancora una volta: Esistono altre misure statistiche che utilizzano campioni …
Le distribuzioni molto distorte come il log-normal non determinano intervalli di confidenza bootstrap accurati. Ecco un esempio che mostra che le aree di coda sinistra e destra sono lontane dall'ideale 0,025, indipendentemente dal metodo bootstrap che si prova in R: require(boot) n <- 25 B <- 1000 nsim <- 1000 …
So che questa domanda è stata posta con il caso mean = median, ma non ho trovato nulla di correlato a mean = mode. Se la modalità è uguale alla media, posso sempre concludere che si tratta di una distribuzione simmetrica? Sarò costretto a conoscere anche la mediana per questo …
Spiegherò il mio problema con un esempio. Supponiamo di voler prevedere il reddito di un individuo in base ad alcuni attributi: {Età, Genere, Paese, Regione, Città}. Hai un set di dati di allenamento come questo train <- data.frame(CountryID=c(1,1,1,1, 2,2,2,2, 3,3,3,3), RegionID=c(1,1,1,2, 3,3,4,4, 5,5,5,5), CityID=c(1,1,2,3, 4,5,6,6, 7,7,7,8), Age=c(23,48,62,63, 25,41,45,19, 37,41,31,50), Gender=factor(c("M","F","M","F", …
Da un lato, ho la regressione alla media e dall'altro ho l' errore del giocatore . L'errore del giocatore d'azzardo è definito da Miller e Sanjurjo (2019) come "la convinzione errata che sequenze casuali abbiano una tendenza sistematica all'inversione, cioè che le serie di risultati simili hanno più probabilità di …
Quando uso GAM, mi dà DF residuo è (ultima riga nel codice). Cosa significa? Andando oltre l'esempio GAM, in generale, il numero di gradi di libertà può essere un numero non intero?26.626.626.6 > library(gam) > summary(gam(mpg~lo(wt),data=mtcars)) Call: gam(formula = mpg ~ lo(wt), data = mtcars) Deviance Residuals: Min 1Q Median …
Quando si esegue il clustering gerarchico, è possibile utilizzare molte metriche per misurare la distanza tra i cluster. Due di queste metriche implicano il calcolo dei centroidi e la media dei punti dati nei cluster. Qual è la differenza tra la media e il centroide? Questi non sono lo stesso …
Voglio derivare i limiti per l' intervallo di confidenza del per il rapporto di due mezzi. Supponiamo che X 1 ∼ N ( θ 1 , σ 2 ) e X 2 ∼ N ( θ 2 , σ 2 ) siano indipendenti, il rapporto medio Γ = θ 1 …
C'è qualcosa di significativo in una media geometrica e media aritmetica che si avvicinano molto, diciamo ~ 0,1%? Quali congetture possono essere fatte su tale set di dati? Ho lavorato sull'analisi di un set di dati e noto ironicamente che i valori sono molto, molto vicini. Non esatto, ma vicino. …
So che se la mediana e la media sono approssimativamente uguali, significa che esiste una distribuzione simmetrica, ma in questo caso particolare non ne sono certo. La media e la mediana sono abbastanza vicine (solo 0,487 m / gall differenza), il che mi porterebbe a dire che c'è una distribuzione …
La sezione 1.7.2 di Rilevazione delle statistiche usando R di Andy Fields, et all, mentre elenca le virtù della media rispetto alla mediana, afferma: ... la media tende ad essere stabile in diversi campioni. Questo dopo aver spiegato le molte virtù della mediana, ad es ... La mediana non è …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.