A pag. 34 di Introduzione all'apprendimento statistico : \newcommand{\Var}{{\rm Var}} Sebbene la dimostrazione matematica esuli dallo scopo di questo libro, è possibile dimostrare che il test MSE previsto, per un dato valore x0x0x_0 , può sempre essere scomposto nella somma di tre quantità fondamentali: la varianza di f^(x0)f^(x0)\hat{f}(x_0) , la …
Ho una serie temporale di dati con conteggi N = 14 in ciascun punto temporale e desidero calcolare il coefficiente di Gini e un errore standard per questa stima in ogni punto temporale. Dato che ho solo N = 14 conteggi in ogni momento ho proceduto calcolando la varianza del …
Ho appena appreso il concetto di bootstrap e mi è venuta in mente una domanda ingenua: se possiamo sempre generare numerosi campioni bootstrap dei nostri dati, perché preoccuparsi di ottenere più dati "reali"? Penso di avere una spiegazione, per favore dimmi se sono corretto: penso che il processo di bootstrap …
Lo so da studi precedenti che Var(A+B)=Var(A)+Var(B)+2Cov(A,B)Var(A+B)=Var(A)+Var(B)+2Cov(A,B)Var(A+B) = Var(A) + Var(B) + 2 Cov (A,B) Tuttavia, non capisco perché. Vedo che l'effetto sarà quello di "aumentare" la varianza quando A e B covary altamente. Ha senso che quando crei un composito da due variabili altamente correlate tenderai ad aggiungere le …
Come posso quantificare la quantità di dispersione in un vettore di conteggi di parole? Sto cercando una statistica che sarà alta per il documento A, perché contiene molte parole diverse che si verificano raramente e bassa per il documento B, perché contiene una parola (o poche parole) che si presentano …
Vorrei capire come posso ottenere la percentuale di varianza di un set di dati, non nello spazio di coordinate fornito da PCA, ma rispetto a un set leggermente diverso di vettori (ruotati). set.seed(1234) xx <- rnorm(1000) yy <- xx * 0.5 + rnorm(1000, sd = 0.6) vecs <- cbind(xx, yy) …
Nel test di ipotesi, una domanda comune è qual è la varianza della popolazione? La mia domanda è: come possiamo mai conoscere la varianza della popolazione? Se conoscessimo l'intera distribuzione, potremmo anche conoscere la media dell'intera popolazione. Allora qual è il punto di verifica delle ipotesi?
Dal titolo vorrei sapere se esiste un test statistico che può aiutarmi a identificare una divergenza significativa tra due serie temporali simili. In particolare, osservando la figura seguente, vorrei rilevare che le serie iniziano a divergere nel tempo t1, ovvero quando la differenza tra loro inizia a essere significativa. Inoltre, …
Voglio stimare la media di una funzione f, cioè dove X e Y sono variabili casuali indipendenti. Ho dei campioni di f ma non iid: ci sono iid di campioni per Y 1 , Y 2 , ... Y n e per ogni Y i ci sono n i campioni …
La ponderazione basata sulla precisione è fondamentale per la meta-analisi? Borenstein et al. (2009) scrivono che per rendere possibile la meta-analisi tutto ciò che è necessario è che: Gli studi riportano una stima puntuale che può essere espressa come un singolo numero. La varianza può essere calcolata per quella stima …
Sto confrontando due dispositivi di controllo della temperatura entrambi progettati per mantenere la temperatura corporea esattamente a 37 gradi nei pazienti anestetizzati. I dispositivi sono stati montati su 500 pazienti che formano due gruppi. Gruppo A (400 pazienti) - Dispositivo 1, Gruppo B (100 pazienti) - Dispositivo 2. Ad ogni …
Nel solito calcolo VIF per una regressione lineare, ogni variabile indipendente / esplicativa viene trattata come la variabile dipendente in una regressione dei minimi quadrati ordinaria. vale a direXjXjX_j Xj= β0+ ∑i = 1 , i ≠ jnβioXioXj=β0+Σio=1,io≠jnβioXio X_j = \beta_0 + \sum_{i=1, i \neq j}^n \beta_i X_i I valori …
Supponiamo un test t di un campione, in cui l'ipotesi nulla è . La statistica è quindi usando la deviazione standard del campione . Nella stima di , si confrontano le osservazioni con la media del campione :μ=μ0μ=μ0\mu=\mu_0t=x¯¯¯−μ0s/n√t=x¯−μ0s/nt=\frac{\overline{x}-\mu_0}{s/\sqrt{n}}ssssssx¯¯¯x¯\overline{x} s=1n−1∑ni=1(xi−x¯¯¯)2−−−−−−−−−−−−−−−√s=1n−1∑i=1n(xi−x¯)2s=\sqrt{\frac{1}{n-1}\sum_{i=1}^n (x_i-\overline{x})^2} . Tuttavia, se assumiamo che un dato sia vero, si …
Se si sta testando l'ipotesi di omoscedasticità, sono disponibili test parametrici (Bartlett Test of Homogeneity of Variances, bartlett.test) e non parametrici (Figner-Killeen Test of Homogeneity of Variances, fligner.test). Come dire quale tipo usare? Ciò dovrebbe dipendere, ad esempio, dalla normalità dei dati?
O quali condizioni lo garantiscono? In generale (e non solo modelli normali e binomiali) suppongo che il motivo principale che ha infranto questa affermazione è che c'è incoerenza tra il modello di campionamento e il precedente, ma cos'altro? Sto iniziando con questo argomento, quindi apprezzo molto gli esempi semplici
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.