La definizione del parametro min_child_weight in xgboost è data come:
somma minima del peso dell'istanza (hessiana) necessaria in un bambino. Se il passaggio della partizione dell'albero risulta in un nodo foglia con la somma del peso dell'istanza inferiore a min_child_weight, il processo di costruzione rinuncerà a un ulteriore partizionamento. In modalità di regressione lineare, ciò corrisponde semplicemente al numero minimo di istanze necessarie per trovarsi in ciascun nodo. Più grande è l'algoritmo più conservativo.
Ho letto alcune cose su xgboost, incluso il documento originale (vedi la formula 8 e quella subito dopo l'equazione 9), questa domanda e molte cose da fare con xgboost che appaiono nelle prime pagine di una ricerca su Google. ;)
Fondamentalmente non sono ancora felice del motivo per cui stiamo imponendo un vincolo sulla somma dell'Assia? Il mio unico pensiero al momento dal documento originale è che si riferisce alla sezione di schizzo quantile ponderata (e alla riformulazione a partire dall'equazione 3 perdita quadrata ponderata) che ha come 'peso' di ogni istanza.
Un'ulteriore domanda si riferisce al perché è semplicemente il numero di istanze in modalità di regressione lineare? Immagino che questo sia correlato alla seconda derivata dell'equazione della somma dei quadrati?