Ho diverse centinaia di misurazioni. Ora sto pensando di utilizzare un qualche tipo di software per correlare ogni misura con ogni misura. Ciò significa che ci sono migliaia di correlazioni. Tra questi ci dovrebbe essere (statisticamente) un'alta correlazione, anche se i dati sono completamente casuali (ogni misura ha solo circa 100 punti dati).
Quando trovo una correlazione, come posso includere le informazioni su quanto ho cercato una correlazione in essa?
Non sono di alto livello nelle statistiche, quindi per favore abbi pazienza.
R
su questa macchina impiega 18 secondi per ottenere 1000 realizzazioni della distribuzione di permutazione nulla del coefficiente di correlazione massimo per una matrice 300 per 100 x
:correl <- function(x, k=1) { n <- dim(x)[2] * (dim(x)[2]-1) / 2; v <- cor(x); sort(v[lower.tri(v)])[(n-k+1):n] }; sim <- replicate(1000, correl(apply(x,2,sample)))