Il problema menzionato in questa domanda è stato risolto nella versione 1.7.3 del pacchetto R glmnet.
Sto riscontrando alcuni problemi con glmnet con family = multinomial, e mi chiedevo di aver riscontrato qualcosa di simile o di essere in grado di dirmi cosa sto facendo di sbagliato.
Quando inserisco i miei dati fittizi, l'errore "Errore nell'applicazione (nz, 1, mediana): dim (X) deve avere una lunghezza positiva" viene segnalato durante l'esecuzione cv.glmnet
, che a parte dire "non ha funzionato" non era estremamente informativo per me.
y=rep(1:3,20) #=> 60 element vector
set.seed(1011)
x=matrix(y+rnorm(20*3*10,sd=0.4),nrow=60) # 60*10 element matrix
glm = glmnet(x,y,family="multinomial") #=> returns without error
crossval = cv.glmnet(x,y,family="multinomial") #=> Error in apply(nz, 1, median) : dim(X) must have a positive length
crossval = cv.glmnet(x,y,family="multinomial",type.measure="class") #=> Error in apply(nz, 1, median) : dim(X) must have a positive length
crossval = cv.glmnet(x,y,family="multinomial",type.measure="mae") #=> Error in apply(nz, 1, median) : dim(X) must have a positive length
cvglm = cv.glmnet(x,y,family="multinomial",lambda=2) #=> Error in apply(nz, 1, median) : dim(X) must have a positive length
Ecco una descrizione visiva del problema che stavo cercando di risolvere glmnet, se questo aiuta:
my_colours = c('red','green','blue')
plot(x[,1],x[,2],col=my_colours[y])
Sono in grado di eseguire il codice di esempio dai documenti del pacchetto, il che mi fa sospettare che o stia fraintendendo qualcosa o che ci sia un bug in glmnet.
library(glmnet)
set.seed(10101)
n=1000;p=30
x=matrix(rnorm(n*p),n,p) #=> 1000*30 element matrix
beta3=matrix(rnorm(30),10,3)
beta3=rbind(beta3,matrix(0,p-10,3))
f3=x%*% beta3
p3=exp(f3)
p3=p3/apply(p3,1,sum)
g3=rmult(p3) #=> 1000 element vector
set.seed(10101)
cvfit=cv.glmnet(x,g3,family="multinomial")
Questo sta usando R versione 2.13.1 (2011-07-08) e glmnet 1.7.1, anche se posso generare lo stesso problema su R 2.14.1. Qualche idea gente?