Qual è il modo migliore per eseguire un groupby su un dataframe Pandas, ma escludere alcune colonne da quel groupby? ad esempio, ho il seguente dataframe:
Code Country Item_Code Item Ele_Code Unit Y1961 Y1962 Y1963
2 Afghanistan 15 Wheat 5312 Ha 10 20 30
2 Afghanistan 25 Maize 5312 Ha 10 20 30
4 Angola 15 Wheat 7312 Ha 30 40 50
4 Angola 25 Maize 7312 Ha 30 40 50
Voglio raggruppare la colonna Paese e Item_Code e calcolare solo la somma delle righe che rientrano nelle colonne Y1961, Y1962 e Y1963. Il dataframe risultante dovrebbe essere simile a questo:
Code Country Item_Code Item Ele_Code Unit Y1961 Y1962 Y1963
2 Afghanistan 15 C3 5312 Ha 20 40 60
4 Angola 25 C4 7312 Ha 60 80 100
In questo momento lo sto facendo:
df.groupby('Country').sum()
Tuttavia, questo somma anche i valori nella colonna Item_Code. C'è un modo per specificare quali colonne includere sum()
nell'operazione e quali escludere?