Sto lavorando a un concorso di scienza dei dati per il quale la distribuzione del mio set di test è diversa dal set di training. Voglio sottocampionare le osservazioni dal set di addestramento che assomiglia molto al set di test.
Come posso fare questo?