Programmazione dataframe

2

L'oggetto "DataFrame" non ha l'attributo "sort"

Devo affrontare qualche problema qui, nel mio pacchetto python ho installato numpy, ma ho ancora questo errore L'oggetto 'DataFrame' non ha l'attributo 'sort' Chiunque può darmi un'idea .. Questo è il mio codice: final.loc[-1] =['', 'P','Actual'] final.index = final.index + 1 # shifting index final = final.sort() final.columns=[final.columns,final.iloc[0]] final = …

101 python pandas numpy dataframe

7

Come spostare una colonna in Pandas DataFrame

Vorrei spostare una colonna in un Panda DataFrame, ma non sono stato in grado di trovare un metodo per farlo dalla documentazione senza riscrivere l'intero DF. Qualcuno sa come farlo? DataFrame: ## x1 x2 ##0 206 214 ##1 226 234 ##2 245 253 ##3 265 272 ##4 283 291 Uscita …

101 python pandas dataframe

1

Modo per leggere le prime righe per i dataframe dei panda

Esiste un modo integrato read_csvper leggere solo le prime nrighe di un file senza conoscere in anticipo la lunghezza delle righe? Ho un file di grandi dimensioni che richiede molto tempo per essere letto, e occasionalmente voglio usare solo le prime, diciamo, 20 righe per ottenerne un campione (e preferisco …

100 python pandas csv dataframe

9

Restituisce più colonne da panda apply ()

Ho un panda dataframe, df_test. Contiene una colonna "size" che rappresenta la dimensione in byte. Ho calcolato KB, MB e GB utilizzando il seguente codice: df_test = pd.DataFrame([ {'dir': '/Users/uname1', 'size': 994933}, {'dir': '/Users/uname2', 'size': 109338711}, ]) df_test['size_kb'] = df_test['size'].astype(int).apply(lambda x: locale.format("%.1f", x / 1024.0, grouping=True) + ' KB') df_test['size_mb'] …

100 python pandas dataframe apply

2

Colonna di binning con panda in pitone

Ho una colonna Data Frame con valori numerici: df['percentage'].head() 46.5 44.2 100.0 42.12 Voglio vedere la colonna come conteggio bin: bins = [0, 1, 5, 10, 25, 50, 100] Come posso ottenere il risultato come bidoni con loro value counts? [0, 1] bin amount [1, 5] etc [5, 10] etc …

99 python pandas numpy dataframe binning

5

come cambiare una colonna Dataframe dal tipo String al tipo Double in pyspark

Ho un dataframe con colonna come String. Volevo cambiare il tipo di colonna in Double type in PySpark. Di seguito è il modo, ho fatto: toDoublefunc = UserDefinedFunction(lambda x: x,DoubleType()) changedTypedf = joindf.withColumn("label",toDoublefunc(joindf['show'])) Volevo solo sapere, è questo il modo giusto per farlo poiché durante la regressione logistica, ricevo un …

99 python apache-spark dataframe pyspark apache-spark-sql

10

Filtra la colonna del dataframe Pyspark con il valore Nessuno

Sto cercando di filtrare un dataframe PySpark che ha Nonecome valore di riga: df.select('dt_mvmt').distinct().collect() [Row(dt_mvmt=u'2016-03-27'), Row(dt_mvmt=u'2016-03-28'), Row(dt_mvmt=u'2016-03-29'), Row(dt_mvmt=None), Row(dt_mvmt=u'2016-03-30'), Row(dt_mvmt=u'2016-03-31')] e posso filtrare correttamente con un valore stringa: df[df.dt_mvmt == '2016-03-31'] # some results here ma questo fallisce: df[df.dt_mvmt == None].count() 0 df[df.dt_mvmt != None].count() 0 Ma ci sono sicuramente …

98 python apache-spark dataframe pyspark apache-spark-sql

6

Converti frame di dati panda in serie

Sono un po 'nuovo per i panda. Ho un frame di dati panda che è 1 riga per 23 colonne. Voglio convertirlo in una serie? Mi chiedo qual è il modo più pitonico per farlo? Ho provato pd.Series(myResults)ma si lamentaValueError: cannot copy sequence with size 23 to array axis with …

98 python pandas dataframe series

7

I panda che selezionano per etichetta a volte restituiscono Serie, a volte restituisce DataFrame

In Pandas, quando seleziono un'etichetta che ha solo una voce nell'indice, ricevo una serie, ma quando seleziono una voce che ha più di una voce ricevo un frame di dati. Perché? C'è un modo per assicurarmi di ottenere sempre un frame di dati? In [1]: import pandas as pd In …

97 python pandas dataframe slice series

4

Come tracciare due colonne di un frame di dati panda usando i punti?

Ho un frame di dati panda e vorrei tracciare i valori di una colonna rispetto ai valori di un'altra colonna. Fortunatamente, esiste un plotmetodo associato ai frame di dati che sembra fare ciò di cui ho bisogno: df.plot(x='col_name_1', y='col_name_2') Sfortunatamente, sembra che tra gli stili di trama (elencati qui dopo …

96 python matplotlib plot pandas dataframe

5

Come posso rendere tutte minuscole le intestazioni delle colonne del dataframe dei panda?

Voglio rendere tutte le intestazioni di colonna nel mio frame di dati Panda in minuscolo Esempio Se ho: data = country country isocode year XRAT tcgdp 0 Canada CAN 2001 1.54876 924909.44207 1 Canada CAN 2002 1.56932 957299.91586 2 Canada CAN 2003 1.40105 1016902.00180 .... Vorrei cambiare XRAT in xrat …

96 python pandas dataframe

6

Sottoinsieme di righe contenenti valori NA (mancanti) in una colonna scelta di un frame di dati

Abbiamo un data frame da un file CSV. Il data frame DFha colonne che contengono valori osservati e una colonna ( VaR2) che contiene la data in cui è stata eseguita una misurazione. Se la data non è stata registrata, il file CSV contiene il valore NA, per i dati …

96 r csv dataframe subset na

1

Dov'è la documentazione sui tag "Freq" di Pandas? [chiuso]

Chiuso. Questa domanda non soddisfa le linee guida di Stack Overflow . Attualmente non accetta risposte. Vuoi migliorare questa domanda? Aggiorna la domanda in modo che sia in argomento per Stack Overflow. Chiuso 3 anni fa . Migliora questa domanda Sono nuovo per Panda e sto cercando di usare date_range. …

96 python pandas documentation dataframe frequency

5

Sostituisci tutti i valori particolari in un data frame

Avendo un data frame, come posso sostituire tutti i valori particolari lungo tutte le righe e le colonne. Supponiamo ad esempio che voglia sostituire tutti i record vuoti con NA's (senza digitare le posizioni): df <- data.frame(list(A=c("", "xyz", "jkl"), B=c(12, "", 100))) A B 1 12 2 xyz 3 jkl …

96 r dataframe replace

3

Annota le barre con i valori sui grafici delle barre di Panda

Stavo cercando un modo per annotare le mie barre in un grafico a barre di Panda con i valori numerici arrotondati dal mio DataFrame. >>> df=pd.DataFrame({'A':np.random.rand(2),'B':np.random.rand(2)},index=['value1','value2'] ) >>> df A B value1 0.440922 0.911800 value2 0.588242 0.797366 Vorrei ottenere qualcosa di simile a questo: Ho provato con questo esempio di …

95 python matplotlib plot pandas dataframe

Domande taggate «dataframe»