Test di significatività per correlazioni
Esistono test di significatività statistica che possono essere applicati a singole correlazioni, che indicano la probabilità di ottenere una correlazione maggiore o maggiore rispetto alla correlazione del campione ipotizzando che l'ipotesi nulla sia vera.
Il punto chiave è che ciò che costituisce un coefficiente di correlazione statisticamente significativo dipende da:
- Dimensione del campione : dimensioni del campione più grandi porteranno a soglie più piccole
- alfa : spesso impostato su 0,005, gli alfa più piccoli porteranno a soglie più elevate per il significato statistico
- test a una coda / a due code : immagino che useresti due code quindi questo probabilmente non ha importanza
- tipo di coefficiente di correlazione : suppongo che tu stia usando Pearson
- ipotesi distributive di xey
In circostanze comuni, dove l'alfa è 0,05, usando il test a due code, con la correlazione di Pearson, e dove la normalità è almeno un'approssimazione adeguata, il fattore principale che influenza il cut-off è la dimensione del campione.
Soglia di importanza
Un altro modo di interpretare la tua domanda è considerare che non sei interessato a stabilire se una correlazione sia statisticamente significativa, ma piuttosto se sia praticamente importante.
Alcuni ricercatori hanno offerto regole empiriche per l'interpretazione del significato dei coefficienti di correlazione, ma queste regole empiriche sono specifiche del dominio.
Test di significatività multipla
Tuttavia, poiché sei interessato a contrassegnare le correlazioni significative in una matrice, questo cambia il contesto inferenziale. Hai correlazioni dove è il numero di variabili (cioè Se l'ipotesi nulla fosse vera per tutte le correlazioni nella matrice, allora più test di significatività si eseguono , quindi più è probabile che tu commetta un errore di tipo I. Ad esempio, nel tuo caso commetterai in media errori tipo I se l'ipotesi nulla fosse vera per tutte le correlazioni.k ( k - 1 ) / 2K14 ( 13 ) / 2 = 9191 ∗ .05 = 4.55
Come ha sottolineato @ user603, questi problemi sono stati ben discussi in questa domanda precedente .
In generale, trovo utile quando si interpreta una matrice di correlazione concentrarsi su una struttura di livello superiore. Questo può essere fatto in modo informale osservando i modelli generali nella matrice di correlazione. Questo può essere fatto in modo più formale usando tecniche come la PCA e l'analisi dei fattori. Tali approcci evitano molte delle problematiche associate ai test di significatività multipla.