Abbiamo un data frame da un file CSV. Il data frame DF
ha colonne che contengono valori osservati e una colonna ( VaR2
) che contiene la data in cui è stata eseguita una misurazione. Se la data non è stata registrata, il file CSV contiene il valore NA
, per i dati mancanti.
Var1 Var2
10 2010/01/01
20 NA
30 2010/03/01
Vorremmo utilizzare il comando subset per definire un nuovo frame di dati in new_DF
modo che contenga solo righe che hanno un NA'
valore dalla colonna ( VaR2
). Nell'esempio fornito, solo la riga 2 sarà contenuta nel nuovo DF
.
Il comando
new_DF<-subset(DF,DF$Var2=="NA")
non funziona, il data frame risultante non ha voci di riga.
Se nel file CSV originale Valore NA
vengono scambiati con NULL
, lo stesso comando produce il risultato desiderato: new_DF<-subset(DF,DF$Var2=="NULL")
.
Come posso far funzionare questo metodo, se per la stringa di caratteri il valore NA
è fornito nel file CSV originale?