Non darò una risposta definitiva in termini di classificazione dei tre. Crea CI del 95% attorno ai tuoi parametri in base a ciascuno e, se sono radicalmente diversi, il tuo primo passo dovrebbe essere quello di scavare più a fondo. Trasforma i tuoi dati (sebbene l'LR sia invariante), regolarizzi le tue probabilità, ecc. In ogni caso, probabilmente opterei per il test LR e l'IC associato. Segue una discussione approssimativa.
L'LR è invariante sotto la scelta della parametrizzazione (es. T contro logit (T)). La statistica Wald assume la normalità di (T - T0) / SE (T). In caso contrario, l'elemento della configurazione è difettoso. La cosa bella di LR è che non è necessario trovare una trasformazione f (T) per soddisfare la normalità. L'IC al 95% basato su T sarà lo stesso. Inoltre, se la tua probabilità non è quadratica, il CI 95% Wald, che è simmetrico, può essere bizzarro poiché potrebbe preferire i valori con una probabilità più bassa a quelli con una probabilità più alta.
Un altro modo di pensare a LR è che sta usando più informazioni, in termini vaghi, dalla funzione di verosimiglianza. Il Wald si basa sul MLE e sulla curvatura della probabilità su null. Il punteggio si basa sulla pendenza su null e sulla curvatura su null. L'LR valuta la probabilità sotto il nullo e la probabilità sotto l'unione del nullo e dell'alternativa e combina i due. Se sei costretto a sceglierne uno, questo potrebbe essere intuitivamente soddisfacente per scegliere l'LR.
Tieni presente che ci sono altri motivi, come la convenienza o il calcolo, per optare per Wald o Punteggio. Il Wald è il più semplice e, dato un parametro multivariato, se stai testando per impostare molti singoli su 0, ci sono modi convenienti per approssimare la probabilità. Oppure, se desideri aggiungere una variabile alla volta da un set, potresti non voler massimizzare la probabilità per ogni nuovo modello e l'implementazione dei test del punteggio offre un certo vantaggio qui. Wald e Score diventano attraenti man mano che i tuoi modelli e la tua probabilità diventano poco attraenti. (Ma non penso che questo sia quello che ti stavi chiedendo, dato che hai tutti e tre disponibili ...)