Esiste un comando Linux che è possibile utilizzare per campionare un sottoinsieme di un file? Ad esempio, un file contiene un milione di righe e vogliamo campionare casualmente solo mille righe da quel file.
Per casuale intendo che ogni linea ha la stessa probabilità di essere scelta e nessuna delle linee scelte è ripetitiva.
head
e tail
può scegliere un sottoinsieme del file ma non in modo casuale. So di poter sempre scrivere uno script Python per farlo, ma mi chiedo solo che esiste un comando per questo utilizzo.