Domande taggate «pandas»

Pandas è una libreria Python per la manipolazione e l'analisi dei dati, ad esempio frame di dati, serie temporali multidimensionali e set di dati trasversali che si trovano comunemente in statistica, risultati scientifici sperimentali, econometria o finanza. Pandas è una delle principali librerie di data science di Python.

4
Applica vs trasforma su un oggetto gruppo
Considera il seguente frame di dati: A B C D 0 foo one 0.162003 0.087469 1 bar one -1.156319 -1.526272 2 foo two 0.833892 -1.666304 3 bar three -2.026673 -0.322057 4 foo two 0.411452 -0.954371 5 bar two 0.765878 -0.095968 6 foo one -0.654890 0.678091 7 foo three -1.789842 -1.130922 …
174 python  pandas 

5
panda loc vs. iloc vs. ix vs. at vs. iat?
Di recente ho iniziato a diramarmi dal mio posto sicuro (R) in Python e sono un po 'confuso dalla localizzazione / selezione delle celle in Pandas. Ho letto la documentazione ma faccio fatica a comprendere le implicazioni pratiche delle varie opzioni di localizzazione / selezione. C'è un motivo per cui …

10
Come salvare un diagramma di Seaborn in un file
Ho provato il seguente codice ( test_seaborn.py): import matplotlib matplotlib.use('Agg') import matplotlib.pyplot as plt matplotlib.style.use('ggplot') import seaborn as sns sns.set() df = sns.load_dataset('iris') sns_plot = sns.pairplot(df, hue='species', size=2.5) fig = sns_plot.get_figure() fig.savefig("output.png") #sns.plt.show() Ma ottengo questo errore: Traceback (most recent call last): File "test_searborn.py", line 11, in <module> fig = …

8
Come stampare Panda DataFrame senza indice
Voglio stampare l'intero frame di dati, ma non voglio stampare l'indice Inoltre, una colonna è di tipo datetime, voglio solo stampare l'ora, non la data. Il frame di dati si presenta come: User ID Enter Time Activity Number 0 123 2014-07-08 00:09:00 1411 1 123 2014-07-08 00:18:00 893 2 123 …

7
Come filtrare le righe nei panda per regex
Vorrei filtrare in modo pulito un dataframe usando regex su una delle colonne. Per un esempio inventato: In [210]: foo = pd.DataFrame({'a' : [1,2,3,4], 'b' : ['hi', 'foo', 'fat', 'cat']}) In [211]: foo Out[211]: a b 0 1 hi 1 2 foo 2 3 fat 3 4 cat Voglio filtrare …
169 python  regex  pandas 

3
Panda: unire (unire) due frame di dati su più colonne
Sto cercando di unire due frame di dati Panda usando due colonne: new_df = pd.merge(A_df, B_df, how='left', left_on='[A_c1,c2]', right_on = '[B_c1,c2]') ma ho ottenuto il seguente errore: pandas/index.pyx in pandas.index.IndexEngine.get_loc (pandas/index.c:4164)() pandas/index.pyx in pandas.index.IndexEngine.get_loc (pandas/index.c:4028)() pandas/src/hashtable_class_helper.pxi in pandas.hashtable.PyObjectHashTable.get_item (pandas/hashtable.c:13166)() pandas/src/hashtable_class_helper.pxi in pandas.hashtable.PyObjectHashTable.get_item (pandas/hashtable.c:13120)() KeyError: '[B_1, c2]' Qualche idea su quale …




6
Pandas DataFrame Group da due colonne e ottenere conteggi
Ho un frame di dati Panda nel seguente formato: df = pd.DataFrame([[1.1, 1.1, 1.1, 2.6, 2.5, 3.4,2.6,2.6,3.4,3.4,2.6,1.1,1.1,3.3], list('AAABBBBABCBDDD'), [1.1, 1.7, 2.5, 2.6, 3.3, 3.8,4.0,4.2,4.3,4.5,4.6,4.7,4.7,4.8], ['x/y/z','x/y','x/y/z/n','x/u','x','x/u/v','x/y/z','x','x/u/v/b','-','x/y','x/y/z','x','x/u/v/w'],['1','3','3','2','4','2','5','3','6','3','5','1','1','1']]).T df.columns = ['col1','col2','col3','col4','col5'] df: col1 col2 col3 col4 col5 0 1.1 A 1.1 x/y/z 1 1 1.1 A 1.7 x/y 3 2 1.1 A 2.5 …
166 python  pandas  dataframe 

4
Come aggiungere una riga di intestazione a un DataFrame Panda
Sto leggendo un file CSV in pandas. Questo file CSV è composto da quattro colonne e alcune righe, ma non ha una riga di intestazione, che voglio aggiungere. Ho provato quanto segue: Cov = pd.read_csv("path/to/file.txt", sep='\t') Frame=pd.DataFrame([Cov], columns = ["Sequence", "Start", "End", "Coverage"]) Frame.to_csv("path/to/file.txt", sep='\t') Ma quando applico il codice, …
166 python  csv  pandas  header 

7
Come visualizzare i panda DataFrame dei float usando una stringa di formato per le colonne?
Vorrei visualizzare un frame di dati Panda con un determinato formato utilizzando print()e IPython display(). Per esempio: df = pd.DataFrame([123.4567, 234.5678, 345.6789, 456.7890], index=['foo','bar','baz','quux'], columns=['cost']) print df cost foo 123.4567 bar 234.5678 baz 345.6789 quux 456.7890 Vorrei in qualche modo costringere questo alla stampa cost foo $123.46 bar $234.57 baz …

4
Pandas DataFrame all'elenco dei dizionari
Ho il seguente DataFrame: articolo cliente1 articolo2 articolo3 1 pomodoro latte di mele 2 patate all'arancia 3 chip di mango al succo che voglio tradurlo in un elenco di dizionari per riga rows = [{'customer': 1, 'item1': 'apple', 'item2': 'milk', 'item3': 'tomato'}, {'customer': 2, 'item1': 'water', 'item2': 'orange', 'item3': 'potato'}, …



Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.