Cosa sono i "valori iniziali" nella funzione glm ()?


12

Quali sono i parametri start, etastart, mustartnel glm function () ? Ho cercato nei documenti e in Internet, ma non ho trovato spiegazioni chiare su cosa significhi.

Assomiglia ai "valori iniziali" bayesiani per le catene, ma dubito che ciò sia correlato, poiché la funzione glm () in R è statistica frequentista ...

Risposte:


10

Ha solo a che fare con la tecnica di stima: come arriva una serie di stime per i parametri nel modello. Un modello lineare generalizzato è adattato da minimi quadrati ripetutamente iterati. Viene scelto un set arbitrario di pesi per iniziare (spesso tutti uguali per cominciare), quindi vengono scelte le stime dei parametri nel predittore lineare che minimizzano la somma ponderata dei quadrati dei residui. Quei parametri stimati nel predittore lineare sono usati per stimare un nuovo vettore di mezzi. Da questo deriva una nuova serie di pesi - ad esempio, a seconda della famiglia e della funzione di collegamento utilizzate, la varianza della risposta potrebbe essere proporzionale alla media della risposta - quindi i pesi saranno inversamente proporzionali alla media. Questo nuovo set di pesi viene utilizzato in una nuova iterazione dell'intera procedura.

Quindi i tre argomenti di glm () che hai chiesto sono solo modi per l'utente di avviare la procedura in un punto arbitrario invece di consentirgli di scegliere il proprio punto di partenza predefinito. Dal file della guida collegato:

  • start - valori iniziali per i parametri nel predittore lineare.
  • etastart: valori iniziali per il predittore lineare.
  • mustart - valori iniziali per il vettore di medie.

Grazie Peter! Assomiglia completamente alla procedura bayesiana MCMC! Pensavo che i pacchetti per frequentisti fossero più intelligenti e non funzionassero in questo modo :-) Questo è ciò di cui ero confuso ... perché mai c'è qualcosa di simile ai valori iniziali nel pacchetto per frequentisti :-)
Curioso

1
A volte senza valori iniziali è possibile non riuscire a convergere o convergere su un massimo locale che non è una soluzione ottimale a livello globale. Quindi è bene avere la possibilità di provare diversi valori iniziali.
Peter Ellis,

Comincio ad avere la sensazione che sia addirittura glm()bayesiano :-)
Curioso il

4
@Curious Non è particolarmente bayesiano. Tutto ciò che chiedete è che il pacchetto software trovi un punto particolare tramite una tecnica di ricerca. I valori iniziali indicano semplicemente da dove iniziare: non dà particolare peso a quella risposta, ma può essere d'aiuto se si aggira per uno spazio complicato. Non c'è niente di particolarmente bayesiano in "
Comincio
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.