Quanto segue è più lento degli approcci cronometrati qui , ma possiamo calcolare la colonna aggiuntiva in base al contenuto di più di una colonna e più di due valori possono essere calcolati per la colonna aggiuntiva.
Semplice esempio usando solo la colonna "Set":
def set_color(row):
if row["Set"] == "Z":
return "red"
else:
return "green"
df = df.assign(color=df.apply(set_color, axis=1))
print(df)
Set Type color
0 Z A red
1 Z B red
2 X B green
3 Y C green
Esempio con più colori e più colonne prese in considerazione:
def set_color(row):
if row["Set"] == "Z":
return "red"
elif row["Type"] == "C":
return "blue"
else:
return "green"
df = df.assign(color=df.apply(set_color, axis=1))
print(df)
Set Type color
0 Z A red
1 Z B red
2 X B green
3 Y C blue
Modifica (21/06/2019): utilizzo di plydata
È anche possibile usare plydata per fare questo tipo di cose (questo sembra ancora più lento dell'uso assign
e apply
, comunque).
from plydata import define, if_else
Semplice if_else
:
df = define(df, color=if_else('Set=="Z"', '"red"', '"green"'))
print(df)
Set Type color
0 Z A red
1 Z B red
2 X B green
3 Y C green
Nidificato if_else
:
df = define(df, color=if_else(
'Set=="Z"',
'"red"',
if_else('Type=="C"', '"green"', '"blue"')))
print(df)
Set Type color
0 Z A red
1 Z B red
2 X B blue
3 Y C green