Ho una domanda "statistica di base". Come studente vorrei sapere se sto pensando a questo totalmente sbagliato e perché, in tal caso:
Diciamo che sto ipoteticamente cercando di esaminare la relazione tra "problemi di gestione della rabbia" e dire il divorzio (sì / no) in una regressione logistica e ho la possibilità di utilizzare due diversi punteggi di gestione della rabbia - entrambi su 100.
Punteggio 1 proviene dallo strumento di valutazione del questionario 1 e dall'altra mia scelta; il punteggio 2 proviene da un questionario diverso. Ipoteticamente, abbiamo motivo di credere da precedenti lavori che i problemi di gestione della rabbia causano il divorzio.
Se, nel mio campione di 500 persone, la varianza del punteggio 1 è molto più alta di quella del punteggio 2, c'è motivo di ritenere che il punteggio 1 sarebbe un punteggio migliore da utilizzare come predittore di divorzio in base alla sua varianza?
Per me, questo istintivamente sembra giusto, ma è così?