Ho trovato definizioni forse contrastanti per la statistica di convalida incrociata (CV) e per la statistica di convalida incrociata generalizzata (GCV) associata a un modello lineare (con un vettore di errore omoscedastico normale ).
Da un lato, Golub, Heath & Wahba definiscono la stima GCV come (p. 216)
il minimizzatore di dato da
dove
D'altra parte, Efron definisce lo stesso concetto di (p. 24), tuttavia attribuisce l'introduzione di questo concetto a Craven & Wahba, dove la sua definizione (p. 377) è essenzialmente la stessa come sopra definito Golub, Heath e Wahba.
Questo significa che minimizza ?
Allo stesso modo, Golub, Heath e Wahba definiscono la stima CV di (p. 217) come minimizzatore di
dove è la stima
di con il esimo punto dati omesso.
Gli autori attribuiscono l'introduzione della stima CV (anche chiamata stima PRESS) ad Allen ("Allen's PRESS", ibid.) Tuttavia nel documento di Allen, la stima PRESS viene definita (p. 126) come (nell'articolo di Efron è definito come (p. 24)).
Ancora una volta, questo significa che minimizza ?
Allen, David M. La relazione tra selezione delle variabili e documentazione dei dati e un metodo di predizione. Technometrics, Vol. 16, n. 1 (febbraio 1974), pagg. 125-127
Craven, Peter e Wahba, Grace. Smoothing dei dati rumorosi con le funzioni spline. Numerische Mathematik 31, (1979), pagg. 377-403
Efron, Bradley. Quanto è distorto il tasso di errore apparente di una regressione logistica? Rapporto tecnico n. 232. Dipartimento di Statistica, Stanford University (aprile 1985)
Golub, Gene H., Heath e Grace Wahba. Convalida incrociata generalizzata come metodo per la scelta di un buon parametro Ridge. Technometrics, Vol. 21, n. 2 (maggio 1979), pagg. 215-223