Domande taggate «non-independent»

Dati, eventi, processi, ecc. Non sono indipendenti se la conoscenza di 1 fornisce alcune informazioni sullo stato o sul valore dell'altro.

5
Sull'importanza dell'assunzione di iid nell'apprendimento statistico
Nell'apprendimento statistico, implicitamente o esplicitamente, si presume sempre che l'insieme di addestramento sia composto da tuple input / response che sono disegnati indipendentemente dalla stessa distribuzione congiunta conD={X,y}D={X,y}\mathcal{D} = \{ \bf {X}, \bf{y} \}NNN(Xi,yi)(Xi,yi)({\bf{X}}_i,y_i) P(X,y)P(X,y)\mathbb{P}({\bf{X}},y) p(X,y)=p(y|X)p(X)p(X,y)=p(y|X)p(X) p({\bf{X}},y) = p( y \vert {\bf{X}}) p({\bf{X}}) e la relazione che stiamo cercando di …


5
Il significato di "dipendenza positiva" come condizione per utilizzare il solito metodo per il controllo FDR
Benjamini e Hochberg hanno sviluppato il primo (e ancora più ampiamente usato, credo) metodo per controllare il tasso di scoperta falsa (FDR). Voglio iniziare con un gruppo di valori P, ciascuno per un confronto diverso, e decidere quali sono abbastanza bassi da essere chiamati una "scoperta", controllando l'FDR su un …

7
La correlazione equivale all'associazione?
Il mio professore di statistica afferma che la parola "correlazione" si applica rigorosamente alle relazioni lineari tra variate, mentre la parola "associazione" si applica ampiamente a qualsiasi tipo di relazione. In altre parole, afferma che il termine "correlazione non lineare" è un ossimoro. Da quello che posso fare di questa …

1
Proprietà del PCA per osservazioni dipendenti
Usiamo solitamente PCA come tecnica di riduzione della dimensionalità per i dati in cui si presume che i casi siano considerati Domanda: Quali sono le sfumature tipiche dell'applicazione del PCA per dati dipendenti e non iid? Quali proprietà utili / utili di PCA che detengono per i dati iid sono …

1
Significato in linguaggio semplice di test "dipendenti" e "indipendenti" nella letteratura sui confronti multipli?
Sia nella letteratura sulla percentuale di errori a livello familiare (FWER) che sulla percentuale di scoperta falsa (FDR), si dice che particolari metodi di controllo della FWER o della FDR siano appropriati per test dipendenti o indipendenti. Ad esempio, nel documento del 1979 "Una semplice procedura di prova multipla in …

3
Per intuizione, quali sono alcuni esempi di vita reale di variabili casuali non correlate ma dipendenti?
Nello spiegare perché non correlato non implica indipendente, ci sono diversi esempi che coinvolgono un mucchio di variabili casuali, ma sembrano tutti così astratti: 1 2 3 4 . Questa risposta sembra avere senso. La mia interpretazione: una variabile casuale e il suo quadrato potrebbero non essere correlati (poiché apparentemente …

1
Perché i modelli di effetti misti risolvono la dipendenza?
Supponiamo che siamo interessati a come i voti degli esami degli studenti sono influenzati dal numero di ore che quegli studenti studiano. Per esplorare questa relazione, potremmo eseguire la seguente regressione lineare: exam.gradesi=a+β1×hours.studiedi+eiexam.gradesio=un'+β1×hours.studiedio+eio \text{exam.grades}_i = a + \beta_1 \times \text{hours.studied}_i + e_i Ma se campioniamo gli alunni di diverse scuole, …

1
Modellazione lineare ad effetti misti con dati di studio gemellati
Supponiamo di avere una certa certa variabile di risposta yijyijy_{ij} che è stato misurato da jjj esima sibling iii esima famiglia. Inoltre, alcuni dati comportamentali xijxijx_{ij} sono stati raccolti contemporaneamente da ciascun soggetto. Sto cercando di analizzare la situazione con il seguente modello lineare a effetti misti: yij=α0+α1xij+δ1ixij+εijyij=α0+α1xij+δ1ixij+εijy_{ij} = \alpha_0 …




5
Come eseguire l'imputazione dei valori in un numero molto elevato di punti dati?
Ho un set di dati molto grande e mancano circa il 5% di valori casuali. Queste variabili sono correlate tra loro. Il seguente set di dati R è solo un esempio di giocattolo con dati correlati fittizi. set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000, replace = TRUE), …
12 r  random-forest  missing-data  data-imputation  multiple-imputation  large-data  definition  moving-window  self-study  categorical-data  econometrics  standard-error  regression-coefficients  normal-distribution  pdf  lognormal  regression  python  scikit-learn  interpolation  r  self-study  poisson-distribution  chi-squared  matlab  matrix  r  modeling  multinomial  mlogit  choice  monte-carlo  indicator-function  r  aic  garch  likelihood  r  regression  repeated-measures  simulation  multilevel-analysis  chi-squared  expected-value  multinomial  yates-correction  classification  regression  self-study  repeated-measures  references  residuals  confidence-interval  bootstrap  normality-assumption  resampling  entropy  cauchy  clustering  k-means  r  clustering  categorical-data  continuous-data  r  hypothesis-testing  nonparametric  probability  bayesian  pdf  distributions  exponential  repeated-measures  random-effects-model  non-independent  regression  error  regression-to-the-mean  correlation  group-differences  post-hoc  neural-networks  r  time-series  t-test  p-value  normalization  probability  moments  mgf  time-series  model  seasonality  r  anova  generalized-linear-model  proportion  percentage  nonparametric  ranks  weighted-regression  variogram  classification  neural-networks  fuzzy  variance  dimensionality-reduction  confidence-interval  proportion  z-test  r  self-study  pdf 


6
Quanto è problematico controllare le covariate non indipendenti in uno studio osservazionale (cioè non randomizzato)?
Miller e Chapman (2001) sostengono che è assolutamente inappropriato controllare le covariate non indipendenti che sono correlate sia alle variabili indipendenti che a quelle dipendenti in uno studio osservazionale (non randomizzato), anche se ciò viene fatto abitualmente nelle scienze sociali. Quanto è problematico farlo? Qual è il modo migliore per …

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.