Ho già letto tutte le pagine di questo sito cercando di trovare la risposta al mio problema, ma nessuno sembra essere quello giusto per me ...
Innanzitutto ti spiego il tipo di dati con cui sto lavorando ...
Diciamo che ho un vettore array con diversi nomi di città, uno per ognuno di 300 utenti. Ho anche un altro vettore di array con risposta dei punteggi a un sondaggio di ciascun utente o un valore continuo per ciascun utente.
Vorrei sapere se esiste un coefficiente di correlazione che calcola la correlazione tra queste due variabili così, variabili nominali e numeriche / ordinali
Ho cercato su Internet e in alcune pagine suggeriscono di utilizzare il coefficiente di contingenza o il coefficiente V o Lambda di Cramer o Eta. Per ciascuna di questa misura, basta dire che potrebbero essere applicati per tali dati in cui abbiamo una variabile nominale e intervallo o variabile numerica. Il fatto è che la ricerca e la ricerca, cercando di comprenderne ognuna, a volte vengono scritte o osservano gli esempi secondo cui è ragionevole usarle se si dispone di una variabile nominale dicotomica, ad eccezione di V di Cramer, altre volte non è scritto alcun requisito per il tipo di dati. Molte altre pagine affermano che è giusto applicare la regressione, giusto, ma vorrei semplicemente sapere se esiste un coefficiente come Pearson / Spearman per questo tipo di dati.
Penso anche che non sia così appropriato usare Spearman Correlation coeff poiché le città non sono ordinabili.
Ho anche creato la funzione di Cramer'sV ed Eta da solo (sto lavorando con Matlab) ma per Eta non parlano di alcun valore p per vedere se il coefficiente è statisticamente significativo ...
Nel sito matlabWorks c'è anche una bella cassetta degli attrezzi che dice di calcolare eta ^ 2 ma il tipo di input di cui ha bisogno non è comprensibile.
Qui c'è qualcuno che ha fatto un test come il mio? Se hai bisogno di maggiori dettagli per capire il tipo di dati che sto usando, chiedimi e cercherò di spiegarti meglio.