Domande taggate «pandas»

Pandas è una libreria Python per la manipolazione e l'analisi dei dati, ad esempio frame di dati, serie temporali multidimensionali e set di dati trasversali che si trovano comunemente in statistica, risultati scientifici sperimentali, econometria o finanza. Pandas è una delle principali librerie di data science di Python.

13
Come stampare un oggetto groupby
Voglio stampare il risultato del raggruppamento con Panda. Ho un dataframe: import pandas as pd df = pd.DataFrame({'A': ['one', 'one', 'two', 'three', 'three', 'one'], 'B': range(6)}) print(df) A B 0 one 0 1 one 1 2 two 2 3 three 3 4 three 4 5 one 5 Quando si stampa …
134 python  pandas 

6
come controllare il dtype di una colonna in python panda
Ho bisogno di utilizzare funzioni diverse per trattare colonne numeriche e colonne stringa. Quello che sto facendo ora è davvero stupido: allc = list((agg.loc[:, (agg.dtypes==np.float64)|(agg.dtypes==np.int)]).columns) for y in allc: treat_numeric(agg[y]) allc = list((agg.loc[:, (agg.dtypes!=np.float64)&(agg.dtypes!=np.int)]).columns) for y in allc: treat_str(agg[y]) C'è un modo più elegante per farlo? Per esempio for y …
134 python  pandas 

4
Panda Python: riempie un frame di dati riga per riga
Il semplice compito di aggiungere una riga a un pandas.DataFrameoggetto sembra essere difficile da realizzare. Ci sono 3 domande stackoverflow relative a questo, nessuna delle quali fornisce una risposta funzionante. Ecco cosa sto cercando di fare. Ho un DataFrame di cui conosco già la forma, nonché i nomi delle righe …
133 python  dataframe  row  pandas 

10
I panda convertono il frame di dati in array di tuple
Ho manipolato alcuni dati utilizzando Panda e ora voglio eseguire un salvataggio in batch nel database. Ciò richiede che io converta il frame di dati in una matrice di tuple, con ogni tupla corrispondente a una "riga" del frame di dati. Il mio DataFrame è simile a: In [182]: data_set …
132 python  pandas 



5
Normalizza i dati in panda
Supponiamo che io abbia un frame di dati Panda df: Voglio calcolare la media saggia della colonna di un frame di dati. Questo è facile: df.apply(average) quindi l'intervallo saggio della colonna max (col) - min (col). Questo è di nuovo facile: df.apply(max) - df.apply(min) Ora per ogni elemento voglio sottrarre …
131 python  pandas  numpy 

3
qual è il modo più efficiente di contare le occorrenze nei panda?
Ho un grande datafame (circa 12 M righe) df con dire: df.columns = ['word','documents','frequency'] Quindi quanto segue ha funzionato in modo tempestivo: word_grouping = df[['word','frequency']].groupby('word') MaxFrequency_perWord = word_grouping[['frequency']].max().reset_index() MaxFrequency_perWord.columns = ['word','MaxFrequency'] Tuttavia, ciò richiede un tempo imprevisto per l'esecuzione: Occurrences_of_Words = word_grouping[['word']].count().reset_index() Cosa sto facendo di sbagliato qui? Esiste un …
131 python  pandas 

2
controlla se la variabile è dataframe
quando la mia funzione f viene chiamata con una variabile, voglio verificare se var è un dataframe pandas: def f(var): if var == pd.DataFrame(): print "do stuff" Immagino che la soluzione potrebbe essere abbastanza semplice ma anche con def f(var): if var.values != None: print "do stuff" Non riesco a …
131 python  pandas 


8
Come posso tracciare Pandas DataFrame separati come sottotrame?
Ho alcuni Pandas DataFrame che condividono la stessa scala di valori, ma con colonne e indici diversi. Quando invoco df.plot(), ottengo immagini di trama separate. quello che voglio veramente è averli tutti nella stessa trama delle sottotrame, ma sfortunatamente non riesco a trovare una soluzione a come e apprezzerei molto …

4
Concatena un elenco di frame di dati panda insieme
Ho un elenco di dataframe Pandas che vorrei combinare in un dataframe Pandas. Sto usando Python 2.7.10 e Pandas 0.16.2 Ho creato l'elenco dei dataframe da: import pandas as pd dfs = [] sqlall = "select * from mytable" for chunk in pd.read_sql_query(sqlall , cnxn, chunksize=10000): dfs.append(chunk) Ciò restituisce un …

7
Rimozione della colonna indice nei panda durante la lettura di un csv
Ho il seguente codice che importa un file CSV. Ci sono 3 colonne e voglio impostare le prime due su variabili. Quando imposto la seconda colonna sulla variabile "efficienza", viene aggiunta anche la colonna indice. Come posso sbarazzarmi della colonna dell'indice? df = pd.DataFrame.from_csv('Efficiency_Data.csv', header=0, parse_dates=False) energy = df.index efficiency …
128 python  pandas 

5
Aggiungi le date mancanti al dataframe dei panda
I miei dati possono avere più eventi in una determinata data o NESSUN evento in una data. Prendo questi eventi, faccio un conteggio per data e li pianifico. Tuttavia, quando li trama, le mie due serie non sempre corrispondono. idx = pd.date_range(df['simpleDate'].min(), df['simpleDate'].max()) s = df.groupby(['simpleDate']).size() Nel codice sopra idx …
128 python  date  plot  pandas  dataframe 


Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.