Un campione è un sottoinsieme di una popolazione. Le statistiche, in generale, riguardano l'uso di campioni per dedurre i parametri che governano una popolazione più ampia (forse infinita).
Ho lavorato su un nuovo metodo per analizzare e analizzare set di dati per identificare e isolare sottogruppi di una popolazione senza conoscere in anticipo le caratteristiche di alcun sottogruppo. Mentre il metodo funziona abbastanza bene con campioni di dati artificiali (ovvero set di dati creati appositamente allo scopo di …
Qual è la differenza tra una popolazione e un campione? Quali variabili e statistiche comuni vengono utilizzate per ognuna e in che modo si relazionano tra loro?
Chiuso. Questa domanda è fuori tema . Al momento non accetta risposte. Vuoi migliorare questa domanda? Aggiorna la domanda in modo che sia in argomento per Cross Validated. Chiuso 2 anni fa . Sto usando il cursore per eseguire una foresta casuale convalidata in modo incrociato su un set di …
Che cosa succede se si preleva un campione casuale e si vede che non è chiaramente rappresentativo, come in una domanda recente . Ad esempio, cosa succede se la distribuzione della popolazione dovrebbe essere simmetrica intorno a 0 e il campione che si estrae casualmente ha osservazioni positive e negative …
Mi sono appena imbattuto in questo documento , che descrive come calcolare la ripetibilità ( nota anche come affidabilità, nota anche come correlazione intraclasse) di una misurazione tramite la modellazione di effetti misti. Il codice R sarebbe: #fit the model fit = lmer(dv~(1|unit),data=my_data) #obtain the variance estimates vc = VarCorr(fit) …
Quando uso GAM, mi dà DF residuo è (ultima riga nel codice). Cosa significa? Andando oltre l'esempio GAM, in generale, il numero di gradi di libertà può essere un numero non intero?26.626.626.6 > library(gam) > summary(gam(mpg~lo(wt),data=mtcars)) Call: gam(formula = mpg ~ lo(wt), data = mtcars) Deviance Residuals: Min 1Q Median …
Ho provato un processo del mondo reale, i tempi di ping della rete. Il "round-trip-time" è misurato in millisecondi. I risultati sono riportati in un istogramma: I tempi di ping hanno un valore minimo, ma una lunga coda superiore. Voglio sapere che cos'è la distribuzione statistica e come stimarne i …
Supponiamo che uno esegua il cosiddetto bootstrap non parametrico tracciando campioni di dimensioni n ciascuno ciascuno dalle n osservazioni originali con sostituzione. Credo che questa procedura equivale a stimare la funzione di distribuzione cumulativa dal cdf empirico:BBBnnnnnn http://en.wikipedia.org/wiki/Empirical_distribution_function e quindi ottenere i campioni di bootstrap simulando osservazioni dalla stima b …
È valido utilizzare la lunghezza media ( hhh ) e il peso medio ( www )) di una determinata popolazione per calcolare l'indice di massa corporea media ( BMI=wh2BMI=wh2BMI = \frac{w}{h^2} ) per quella popolazione?
Conosco relativamente bene la distinzione tra termini statistici e parametro. Vedo una statistica come il valore ottenuto dall'applicazione di una funzione ai dati di esempio. Tuttavia, la maggior parte degli esempi di parametri si riferisce alla definizione di una distribuzione parametrica. Un esempio comune è la media e la deviazione …
Spero che questa domanda non venga contrassegnata "come troppo generale" e spero che inizi una discussione a beneficio di tutti. In statistica, dedichiamo molto tempo all'apprendimento di grandi teorie campionarie. Siamo profondamente interessati a valutare le proprietà asintotiche dei nostri stimatori, incluso se sono asintoticamente imparziali, asintoticamente efficienti, la loro …
Quali sono i pro e i contro dell'utilizzo di LARS [1] rispetto all'utilizzo della discesa delle coordinate per l'adattamento della regressione lineare regolarizzata L1? Sono principalmente interessato agli aspetti prestazionali (i miei problemi tendono ad avere Ntra le centinaia di migliaia e p<20). Tuttavia, anche altre intuizioni sarebbero apprezzate. modifica: …
Queste due espressioni mi hanno confuso molto quando stavo imparando le statistiche. Mi sembra che siano cose totalmente diverse. Un campione casuale consiste nel prelevare in modo casuale un campione da una popolazione, mentre una variabile casuale è come una funzione che mappa l'insieme di tutti i possibili risultati di …
Le competizioni Kaggle determinano le classifiche finali in base a un set di prove disputato. Un set di test tenuto fuori è un campione; potrebbe non essere rappresentativo della popolazione modellata. Dato che ogni invio è come un'ipotesi, l'algoritmo che ha vinto la competizione potrebbe, per caso, aver finito per …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.