Ho bisogno di adattarsi RandomForestRegressor
da sklearn.ensemble
.
forest = ensemble.RandomForestRegressor(**RF_tuned_parameters)
model = forest.fit(train_fold, train_y)
yhat = model.predict(test_fold)
Questo codice ha sempre funzionato fino a quando non ho eseguito una preelaborazione dei dati ( train_y
). Il messaggio di errore dice:
DataConversionWarning: un vettore di colonna y è stato passato quando era previsto un array 1d. Si prega di cambiare la forma di y in (n_samples,), ad esempio usando ravel ().
model = forest.fit (train_fold, train_y)
In precedenza train_y
era una serie, ora è un array numpy (è un vettore colonna). Se applico train_y.ravel()
, diventa un vettore riga e non appare alcun messaggio di errore, attraverso il passaggio di previsione ci vuole molto tempo (in realtà non finisce mai ...).
Nei documenti di RandomForestRegressor
ho scoperto che train_y
dovrebbe essere definito come y : array-like, shape = [n_samples] or [n_samples, n_outputs]
Qualche idea su come risolvere questo problema?
train_y
dati per assicurarti che la pre-elaborazione non li abbia corrotti?
RF_tuned_parameters
per noi per favore.
train_fold.shape
etrain_y.shape
?