Ho visto il tuo script (jcbermu) su come selezionare le colonne e copiarlo in un nuovo file. Funziona perfettamente se tutte le colonne sono delimitate da spazi (qualsiasi numero di spazi funzionerà bene). Vorrei migliorare lo script del tour per lavorare in un file con questo formato speciale:
- La prima riga ha le intestazioni per ogni colonna (animalid snp1 snp2 ecc.) Sono separate da spazio.
- Secondo raw: FirstColumn ha l'animale, lo spazio, quindi tutti i genotipi SNP (una cella per SNP) e sono tutti insieme come un blocco (i genotipi non sono separati da spazio).
Quindi, come dire nello script che dopo la riga 1 e dopo la colonna 1, abbiamo i dati delle colonne non separati (ogni cella è un campo).
Esempio del mio file:
animalid snp1 snp2 snp3 snp4 snp5 snp6 snp7 ....... snp8000
fish1 2020121 ....... 2
fish2 0202102 ....... 1
fish3 1201201 ....... 2
.
.
Fish1500 2010211 ...... 1