Ho un frame di dati con valori di ripetizione nella colonna A. Voglio eliminare i duplicati, mantenendo la riga con il valore più alto nella colonna B.
Così questo:
A B
1 10
1 20
2 30
2 40
3 10
Dovrebbe trasformarsi in questo:
A B
1 20
2 40
3 10
Wes ha aggiunto alcune belle funzionalità per eliminare i duplicati: http://wesmckinney.com/blog/?p=340 . Ma AFAICT, è progettato per duplicati esatti, quindi non si fa menzione di criteri per la selezione delle righe da conservare.
Immagino che ci sia probabilmente un modo semplice per farlo --- forse facile come ordinare il frame di dati prima di eliminare i duplicati --- ma non conosco la logica interna di groupby abbastanza bene da capirlo. Eventuali suggerimenti?