La pandas
drop_duplicates
funzione è ottima per "unificare" un frame di dati. Tuttavia, uno degli argomenti delle parole chiave da passare è take_last=True
o take_last=False
, mentre vorrei eliminare tutte le righe che sono duplicate in un sottoinsieme di colonne. È possibile?
A B C
0 foo 0 A
1 foo 1 A
2 foo 1 B
3 bar 1 A
Ad esempio, vorrei eliminare le righe corrispondenti alle colonne A
e C
quindi ciò dovrebbe eliminare le righe 0 e 1.