Nell'apprendimento statistico, implicitamente o esplicitamente, si presume sempre che l'insieme di addestramento sia composto da tuple input / response che sono disegnati indipendentemente dalla stessa distribuzione congiunta conD={X,y}D={X,y}\mathcal{D} = \{ \bf {X}, \bf{y} \}NNN(Xi,yi)(Xi,yi)({\bf{X}}_i,y_i) P(X,y)P(X,y)\mathbb{P}({\bf{X}},y) p(X,y)=p(y|X)p(X)p(X,y)=p(y|X)p(X) p({\bf{X}},y) = p( y \vert {\bf{X}}) p({\bf{X}}) e la relazione che stiamo cercando di …
Per la trama 1, posso testare l'associazione tra xey facendo una semplice correlazione. Per la trama 2, dove la relazione non è lineare ma esiste una chiara relazione tra xey, come posso testare l'associazione ed etichettarne la natura?
Benjamini e Hochberg hanno sviluppato il primo (e ancora più ampiamente usato, credo) metodo per controllare il tasso di scoperta falsa (FDR). Voglio iniziare con un gruppo di valori P, ciascuno per un confronto diverso, e decidere quali sono abbastanza bassi da essere chiamati una "scoperta", controllando l'FDR su un …
Il mio professore di statistica afferma che la parola "correlazione" si applica rigorosamente alle relazioni lineari tra variate, mentre la parola "associazione" si applica ampiamente a qualsiasi tipo di relazione. In altre parole, afferma che il termine "correlazione non lineare" è un ossimoro. Da quello che posso fare di questa …
Usiamo solitamente PCA come tecnica di riduzione della dimensionalità per i dati in cui si presume che i casi siano considerati Domanda: Quali sono le sfumature tipiche dell'applicazione del PCA per dati dipendenti e non iid? Quali proprietà utili / utili di PCA che detengono per i dati iid sono …
Sia nella letteratura sulla percentuale di errori a livello familiare (FWER) che sulla percentuale di scoperta falsa (FDR), si dice che particolari metodi di controllo della FWER o della FDR siano appropriati per test dipendenti o indipendenti. Ad esempio, nel documento del 1979 "Una semplice procedura di prova multipla in …
Nello spiegare perché non correlato non implica indipendente, ci sono diversi esempi che coinvolgono un mucchio di variabili casuali, ma sembrano tutti così astratti: 1 2 3 4 . Questa risposta sembra avere senso. La mia interpretazione: una variabile casuale e il suo quadrato potrebbero non essere correlati (poiché apparentemente …
Supponiamo che siamo interessati a come i voti degli esami degli studenti sono influenzati dal numero di ore che quegli studenti studiano. Per esplorare questa relazione, potremmo eseguire la seguente regressione lineare: exam.gradesi=a+β1×hours.studiedi+eiexam.gradesio=un'+β1×hours.studiedio+eio \text{exam.grades}_i = a + \beta_1 \times \text{hours.studied}_i + e_i Ma se campioniamo gli alunni di diverse scuole, …
Supponiamo di avere una certa certa variabile di risposta yijyijy_{ij} che è stato misurato da jjj esima sibling iii esima famiglia. Inoltre, alcuni dati comportamentali xijxijx_{ij} sono stati raccolti contemporaneamente da ciascun soggetto. Sto cercando di analizzare la situazione con il seguente modello lineare a effetti misti: yij=α0+α1xij+δ1ixij+εijyij=α0+α1xij+δ1ixij+εijy_{ij} = \alpha_0 …
Come viene definita la varianza di lungo periodo nel regno dell'analisi delle serie temporali? Capisco che viene utilizzato nel caso in cui vi sia una struttura di correlazione nei dati. Quindi il nostro processo stocastico non sarebbe una famiglia di X1,X2…X1,X2…X_1, X_2 \dots variabili casuali ma piuttosto distribuite in modo …
So che la media della somma delle variabili indipendenti è la somma delle medie di ciascuna variabile indipendente. Questo vale anche per le variabili dipendenti?
Ho un set di dati molto grande e mancano circa il 5% di valori casuali. Queste variabili sono correlate tra loro. Il seguente set di dati R è solo un esempio di giocattolo con dati correlati fittizi. set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000, replace = TRUE), …
Spiegare qual è la differenza tra se due variabili sono linearmente dipendenti o linearmente correlate . Ho cercato l'articolo di Wikipedia ma non ho avuto un esempio corretto. Per favore spiegalo con l'esempio.
Miller e Chapman (2001) sostengono che è assolutamente inappropriato controllare le covariate non indipendenti che sono correlate sia alle variabili indipendenti che a quelle dipendenti in uno studio osservazionale (non randomizzato), anche se ciò viene fatto abitualmente nelle scienze sociali. Quanto è problematico farlo? Qual è il modo migliore per …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.