Metodi di ricampionamento del cursore


20

Sto usando la libreria caretin R per testare varie procedure di modellazione.

L' trainControloggetto consente di specificare un metodo di ricampionamento. I metodi sono descritti nella documentazione di sezione 2.3 ed includono: boot, boot632, cv, LOOCV, LGOCV, repeatedcve oob. Sebbene alcuni di questi siano facili da dedurre, non tutti questi metodi sono chiaramente definiti.

Quali sono le procedure corrispondenti a questi metodi di ricampionamento?


il collegamento alla documentazione è interrotto. Usa questo invece.
Vikas,

Risposte:


20

Ok, ecco il mio tentativo:

  • boot - bootstrap
  • boot632 - 0.632 bootstrap
  • cv - cross-validation, probabilmente questo si riferisce a K-fold cross-validation .
  • LOOCV - convalida incrociata senza interruzioni, nota anche come jacknife.
  • LGOCV - convalida incrociata con esclusione dal gruppo, variante di LOOCV per dati gerarchici.
  • repeatcv - è probabilmente ripetuta la validazione casuale dei sottocampionamenti , ovvero la divisione per addestrare e testare i dati è fatta in modo casuale.
  • oob - si riferisce alla stima out-of-bag proposta da Breiman , che è ulteriormente correlata all'aggregazione bootstrap . (Il file nel collegamento non è un file ps, ma un file ps.Z, rinominalo e quindi prova ad aprirlo.)

1
Credo che LGOCV stia casualmente dividendo tra un set di addestramento e un set di validazione, ripetuto n volte. Quindi, invece del normale caso di suddivisione dei dati tra treno e attesa (costruire il modello sul treno e convalidare la tenuta) una volta, questo processo viene ripetuto più volte.
B_Miner

3
Credo anche che ripetuto CV sia k-fold cross validation, fatto più volte.
B_Miner

Difficile credere che questo non sia documentato da qualche parte.
Andrew

4

La repeatedcvconvalida incrociata ripetuta 10 volte di sicuro, secondo la presentazione di Max Kuhn. Lo schema di ricampionamento predefinito è il bootstrap.

Un buon file che puoi esaminare sui metodi di ricampionamento è la modellazione predittiva con R e il pacchetto di inserimento ( pdf ). Max lo ha presentato in "useR! 2013".

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.