Come notato (ad esempio, in Wikipedia ), MAPE può essere problematico. Soprattutto, può causare errori di divisione per zero. La mia ipotesi è che questo è il motivo per cui non è incluso nelle metriche sklearn.
Tuttavia, è semplice da implementare.
from sklearn.utils import check_arrays
def mean_absolute_percentage_error(y_true, y_pred):
y_true, y_pred = check_arrays(y_true, y_pred)
## Note: does not handle mix 1d representation
#if _is_1d(y_true):
# y_true, y_pred = _check_1d_array(y_true, y_pred)
return np.mean(np.abs((y_true - y_pred) / y_true)) * 100
Usa come qualsiasi altra metrica ...:
> y_true = [3, -0.5, 2, 7]; y_pred = [2.5, -0.3, 2, 8]
> mean_absolute_percentage_error(y_true, y_pred)
Out[19]: 17.738095238095237
(Nota che sto moltiplicando per 100 e restituendo una percentuale.)
... ma con cautela:
> y_true = [3, 0.0, 2, 7]; y_pred = [2.5, -0.3, 2, 8]
> #Note the zero in y_pred
> mean_absolute_percentage_error(y_true, y_pred)
-c:8: RuntimeWarning: divide by zero encountered in divide
Out[21]: inf