So che mi manca qualcosa nella mia comprensione della regressione logistica e apprezzerei molto qualsiasi aiuto.
Per quanto ho capito, la regressione logistica presuppone che la probabilità di un risultato "1" dato gli input, sia una combinazione lineare degli input, passata attraverso una funzione inversa-logistica. Questo è esemplificato nel seguente codice R:
#create data:
x1 = rnorm(1000) # some continuous variables
x2 = rnorm(1000)
z = 1 + 2*x1 + 3*x2 # linear combination with a bias
pr = 1/(1+exp(-z)) # pass through an inv-logit function
y = pr > 0.5 # take as '1' if probability > 0.5
#now feed it to glm:
df = data.frame(y=y,x1=x1,x2=x2)
glm =glm( y~x1+x2,data=df,family="binomial")
e ricevo il seguente messaggio di errore:
Messaggi di avviso: 1: glm.fit: l'algoritmo non converge 2: glm.fit: probabilità adattate numericamente 0 o 1 verificatesi
Ho lavorato con R per qualche tempo; abbastanza per sapere che probabilmente sono io la colpa .. cosa sta succedendo qui?