Un approccio semplice sarebbe il seguente.
Per le due domande di preferenza, prendi la differenza assoluta tra le risposte dei due rispondenti, dando due variabili, diciamo z1 e z2, anziché quattro.
Per le domande importanti, potrei creare un punteggio che combini le due risposte. Se le risposte fossero, diciamo, (1,1), darei un 1, un (1,2) o (2,1) ottiene un 2, un (1,3) o (3,1) ottiene un 3, un (2,3) o (3,2) ottiene un 4 e un (3,3) ottiene un 5. Chiamiamo questo "punteggio di importanza". Un'alternativa sarebbe solo usare max (response), dando 3 categorie invece di 5, ma penso che la versione a 5 categorie sia migliore.
Ora creerei dieci variabili, x1 - x10 (per concretezza), tutte con valori predefiniti pari a zero. Per quelle osservazioni con un punteggio di importanza per la prima domanda = 1, x1 = z1. Se anche il punteggio di importanza per la seconda domanda = 1, x2 = z2. Per quelle osservazioni con un punteggio di importanza per la prima domanda = 2, x3 = z1 e se il punteggio di importanza per la seconda domanda = 2, x4 = z2 e così via. Per ogni osservazione, esattamente uno di x1, x3, x5, x7, x9! = 0, e allo stesso modo per x2, x4, x6, x8, x10.
Avendo fatto tutto ciò, avrei eseguito una regressione logistica con il risultato binario come variabile target e x1 - x10 come regressori.
Versioni più sofisticate di questo potrebbero creare punteggi di importanza maggiore consentendo di trattare in modo diverso l'importanza dell'intervistato maschile e femminile, ad esempio a (1,2)! = A (2,1), dove abbiamo ordinato le risposte per sesso.
Un difetto di questo modello è che potresti avere più osservazioni della stessa persona, il che significherebbe che gli "errori", parlando liberamente, non sono indipendenti tra le osservazioni. Tuttavia, con molte persone nel campione, probabilmente lo ignorerei, per un primo passaggio, o costruisco un campione in cui non c'erano duplicati.
Un altro difetto è che è plausibile che all'aumentare dell'importanza, aumenterebbe anche l'effetto di una data differenza tra le preferenze su p (fail), il che implica una relazione tra i coefficienti di (x1, x3, x5, x7, x9) e anche tra i coefficienti di (x2, x4, x6, x8, x10). (Probabilmente non è un ordinamento completo, poiché non è a priori chiaro per me come un punteggio di importanza (2,2) sia correlato a un punteggio di importanza (1,3)). Tuttavia, non lo abbiamo imposto nel modello. Probabilmente lo ignorerei all'inizio, e vedrei se sono sorpreso dai risultati.
Il vantaggio di questo approccio è che non impone alcuna ipotesi sulla forma funzionale della relazione tra "importanza" e la differenza tra le risposte di preferenza. Ciò contraddice il precedente commento sul deficit, ma ritengo che la mancanza di una forma funzionale imposta sia probabilmente più vantaggiosa della relativa incapacità di tenere conto delle relazioni attese tra i coefficienti.