Devo dividere una colonna che contiene informazioni in più colonne.
Vorrei usare tstrsplit
ma lo stesso tipo di informazioni non è nello stesso ordine tra le righe e devo estrarre il nome della nuova colonna all'interno della variabile. Importante da sapere: possono esserci molte informazioni (campi per diventare nuove variabili) e non le conosco tutte, quindi non voglio una soluzione "campo per campo".
Di seguito è riportato un esempio di ciò che ho:
library(data.table)
myDT <- structure(list(chr = c("chr1", "chr2", "chr4"), pos = c(123L,
435L, 120L), info = c("type=3;end=4", "end=6", "end=5;pos=TRUE;type=2"
)), class = c("data.table", "data.frame"), row.names = c(NA,-3L))
# chr pos info
#1: chr1 123 type=3;end=4
#2: chr2 435 end=6
#3: chr4 120 end=5;pos=TRUE;type=2
E vorrei ottenere:
# chr pos end pos type
#1: chr1 123 4 <NA> 3
#2: chr2 435 6 <NA> <NA>
#3: chr4 120 5 TRUE 2
Un modo molto semplice per ottenerlo sarebbe molto apprezzato! ( Nota: non sono disposto ad andare con un modo dplyr / tidyr )