Ho un frame di dati Panda con diverse voci e voglio calcolare la correlazione tra le entrate di un tipo di negozi. Esistono numerosi negozi con dati sul reddito, classificazione dell'area di attività (teatro, negozi di vestiti, cibo ...) e altri dati.
Ho provato a creare un nuovo frame di dati e inserire una colonna con le entrate di tutti i tipi di negozi che appartengono alla stessa categoria, e il frame di dati di ritorno ha solo la prima colonna riempita e il resto è pieno di NaN. Il codice che mi sono stancato:
corr = pd.DataFrame()
for at in activity:
stores.loc[stores['Activity']==at]['income']
Voglio farlo, quindi posso usare .corr()
per dare la matrice di correlazione tra la categoria di negozi.
Successivamente, vorrei sapere come posso tracciare i valori della matrice (da -1 a 1, poiché voglio usare la correlazione di Pearson) con matplolib.