Ho un dataframe (df1) come questo.
f1 f2 f3 f4 f5
d1 1 0 1 1 1
d2 1 0 0 1 0
d3 0 0 0 1 1
d4 0 1 0 0 1
La colonna d1 ... d4 è il nome del nome, la riga f1 ... f5 è il nome della colonna.
Per fare il campione (df1), ottengo un nuovo dataframe con conteggio di 1 uguale a df1. Quindi, il conteggio di 1 viene conservato per l'intero dataframe ma non per ogni riga o colonna.
È possibile eseguire la randomizzazione per riga o per colonna?
Voglio randomizzare la colonna df1 per ogni colonna, cioè il numero di 1 in ogni colonna rimane lo stesso. e ogni colonna deve essere modificata almeno una volta. Ad esempio, potrei avere un df2 randomizzato come questo: (notato che il conteggio di 1 in ogni colonna rimane lo stesso ma il conteggio di 1 in ogni riga è diverso.
f1 f2 f3 f4 f5
d1 1 0 0 0 1
d2 0 1 0 1 1
d3 1 0 0 1 1
d4 0 0 1 1 0
Allo stesso modo, voglio anche randomizzare il df1 per riga per ogni riga, cioè il no. di 1 in ogni riga rimane lo stesso e ogni riga deve essere modificata (ma il numero delle voci modificate potrebbe essere diverso). Ad esempio, un df3 randomizzato potrebbe essere qualcosa del genere:
f1 f2 f3 f4 f5
d1 0 1 1 1 1 <- two entries are different
d2 0 0 1 0 1 <- four entries are different
d3 1 0 0 0 1 <- two entries are different
d4 0 0 1 0 1 <- two entries are different
PS. Mille grazie per l'aiuto di Gavin Simpson, Joris Meys e Chase per le risposte precedenti alla mia precedente domanda sulla randomizzazione di due colonne.