Sto modellando la previsione del diabete usando la regressione logistica. Il set di dati utilizzato è il Behavioral Risk Factor Surveillance System (BRFSS) del Center for Disease Control (CDC). Una delle variabili indipendenti è la pressione alta. È categorico con i seguenti livelli "Sì", "No", "Non so / Rifiutato". Devo rimuovere quelle righe con "Non so / Rifiutato" durante la creazione del modello? Che differenza fa mantenere o rimuovere quelle righe dal modello?