Sto cercando un modo per eseguire l'equivalente di SQL
SELECT DISTINCT col1, col2 FROM dataframe_table
Il confronto sql panda non ha nulla a che fare distinct
.
.unique()
funziona solo per una singola colonna, quindi suppongo di poter concatenare le colonne o metterle in una lista / tupla e confrontarle in questo modo, ma questo sembra qualcosa che i panda dovrebbero fare in un modo più nativo.
Mi manca qualcosa di ovvio o non c'è modo di farlo?
df.apply(pd.Series.unique)
ma questo non funzionerà se il numero di valori univoci varia tra le colonne, quindi dovresti costruire un dict dei nomi delle colonne come chiavi e dei valori univoci come valori