Sto usando i panda come sostituto del db poiché ho più database (oracle, mssql, ecc.) E non sono in grado di eseguire una sequenza di comandi con un equivalente SQL.
Ho una tabella caricata in un DataFrame con alcune colonne:
YEARMONTH, CLIENTCODE, SIZE, .... etc etc
In SQL, contare la quantità di client diversi all'anno sarebbe:
SELECT count(distinct CLIENTCODE) FROM table GROUP BY YEARMONTH;
E il risultato sarebbe
201301 5000
201302 13245
Come posso farlo nei panda?
value_counts
potrebbe essere la risposta che stai cercando: pandas.pydata.org/pandas-docs/stable/generated/…