Come ho spiegato nel mio commento sull'altra tua domanda, step
usa l'AIC anziché i valori p.
Tuttavia, per una singola variabile per volta, AIC non corrispondono ad utilizzare un valore p 0,15 (o per essere più precisi, 0,1573):
Considera di confrontare due modelli, che differiscono per una singola variabile. Chiama i modelli (modello più piccolo) e (modello più grande) e lascia che i loro AIC siano rispettivamente e .M 1 AIC 0 AIC 1M0M1AIC0AIC1
Usando il criterio AIC, useresti il modello più grande se . Questo sarà il caso se . - 2 registro L 0 - ( - 2 registro L 1 ) > 2AIC1<AIC0−2logL0−(−2logL1)>2
Ma questa è semplicemente la statistica in un test del rapporto di verosimiglianza. Dal teorema di Wilks, rifiuteremo il valore nullo se la statistica supera il quantile superiore di un . Quindi, se utilizziamo un test di ipotesi per scegliere tra il modello più piccolo e quello più grande, scegliamo il modello più grande quando .χ 2 1 - 2 log L 0 - ( - 2 log L 1 ) > C ααχ21−2logL0−(−2logL1)>Cα
Ora trova al 84,27 percentile di un . Quindi, se scegliamo il modello più grande quando ha un AIC più piccolo, ciò corrisponde a rifiutare l'ipotesi nulla per un test del termine aggiuntivo con un valore p di oχ 2 1 1 - 0,843 = 0,157 15,7 %2χ211−0.843=0.15715.7%
Quindi come lo modifichi?
Facile. Cambia il k
parametro step
da 2 a qualcos'altro. Vuoi invece il 10%? Fallo 2.7:
qchisq(0.10,1,lower.tail=FALSE)
[1] 2.705543
Vuoi il 2,5%? Impostare k=5
:
qchisq(0.025,1,lower.tail=FALSE)
[1] 5.023886
e così via.
Tuttavia, anche se questo risolve la tua domanda, ti consiglio di prestare molta attenzione alla risposta di Frank Harrell sull'altra tua domanda, e di cercare le risposte di molti statistici su altre domande relative alla regressione graduale qui, il cui consiglio tende ad essere molto costantemente per evitare procedure graduali in generale.