La funzione di base R glm()
utilizza Fishers Scoring per MLE, mentre glmnet
sembra utilizzare il metodo di discesa delle coordinate per risolvere la stessa equazione. La discesa coordinata è più efficiente in termini di tempo rispetto al punteggio Fisher, in quanto il punteggio Fisher calcola la matrice derivata del secondo ordine, oltre ad alcune altre operazioni con la matrice. il che rende costoso eseguire, mentre la discesa delle coordinate può fare la stessa attività in O (np) tempo.
Perché la funzione di base R dovrebbe utilizzare il punteggio Fisher? Questo metodo ha un vantaggio rispetto ad altri metodi di ottimizzazione? Come si confrontano la discesa delle coordinate e il punteggio Fisher? Sono relativamente nuovo per fare questo campo, quindi qualsiasi aiuto o risorsa sarà utile.