Sto cercando di creare un semplice grafico a dispersione in pyplot utilizzando un oggetto Pandas DataFrame, ma voglio un modo efficiente di tracciare due variabili ma avere i simboli dettati da una terza colonna (chiave). Ho provato vari modi utilizzando df.groupby, ma non con successo. Di seguito è riportato uno script df di esempio. Questo colora gli indicatori in base a "chiave1", ma a me piace vedere una legenda con categorie "chiave1". Sono vicino? Grazie.
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
df = pd.DataFrame(np.random.normal(10,1,30).reshape(10,3), index = pd.date_range('2010-01-01', freq = 'M', periods = 10), columns = ('one', 'two', 'three'))
df['key1'] = (4,4,4,6,6,6,8,8,8,8)
fig1 = plt.figure(1)
ax1 = fig1.add_subplot(111)
ax1.scatter(df['one'], df['two'], marker = 'o', c = df['key1'], alpha = 0.8)
plt.show()











