Va bene, quindi penso di avere un campione abbastanza decente, tenendo conto della regola empirica 20: 1: un campione abbastanza grande (N = 374) per un totale di 7 variabili predittive candidate.
Il mio problema è il seguente: qualunque sia il set di variabili predittive che utilizzo, le classificazioni non migliorano mai di una specificità del 100% e di una sensibilità dello 0%. Per quanto insoddisfacente, questo potrebbe effettivamente essere il miglior risultato possibile, dato l'insieme di variabili predittive candidate (da cui non posso deviare).
Ma non ho potuto fare a meno di pensare di poter fare di meglio, quindi ho notato che le categorie della variabile dipendente erano bilanciate in modo abbastanza irregolare, quasi 4: 1. Un sottocampione più equilibrato potrebbe migliorare le classificazioni?