Domande taggate «dataframe»

Un frame di dati è una struttura di dati tabulare. Di solito, contiene dati in cui le righe sono osservazioni e le colonne sono variabili di vario tipo. Mentre "data frame" o "dataframe" è il termine utilizzato per questo concetto in diverse lingue (R, Apache Spark, deedle, Maple, la libreria panda in Python e la libreria DataFrames in Julia), "tabella" è il termine utilizzato in MATLAB e SQL.

2
L'oggetto "DataFrame" non ha l'attributo "sort"
Devo affrontare qualche problema qui, nel mio pacchetto python ho installato numpy, ma ho ancora questo errore L'oggetto 'DataFrame' non ha l'attributo 'sort' Chiunque può darmi un'idea .. Questo è il mio codice: final.loc[-1] =['', 'P','Actual'] final.index = final.index + 1 # shifting index final = final.sort() final.columns=[final.columns,final.iloc[0]] final = …

7
Come spostare una colonna in Pandas DataFrame
Vorrei spostare una colonna in un Panda DataFrame, ma non sono stato in grado di trovare un metodo per farlo dalla documentazione senza riscrivere l'intero DF. Qualcuno sa come farlo? DataFrame: ## x1 x2 ##0 206 214 ##1 226 234 ##2 245 253 ##3 265 272 ##4 283 291 Uscita …
101 python  pandas  dataframe 

1
Modo per leggere le prime righe per i dataframe dei panda
Esiste un modo integrato read_csvper leggere solo le prime nrighe di un file senza conoscere in anticipo la lunghezza delle righe? Ho un file di grandi dimensioni che richiede molto tempo per essere letto, e occasionalmente voglio usare solo le prime, diciamo, 20 righe per ottenerne un campione (e preferisco …
100 python  pandas  csv  dataframe 

9
Restituisce più colonne da panda apply ()
Ho un panda dataframe, df_test. Contiene una colonna "size" che rappresenta la dimensione in byte. Ho calcolato KB, MB e GB utilizzando il seguente codice: df_test = pd.DataFrame([ {'dir': '/Users/uname1', 'size': 994933}, {'dir': '/Users/uname2', 'size': 109338711}, ]) df_test['size_kb'] = df_test['size'].astype(int).apply(lambda x: locale.format("%.1f", x / 1024.0, grouping=True) + ' KB') df_test['size_mb'] …

2
Colonna di binning con panda in pitone
Ho una colonna Data Frame con valori numerici: df['percentage'].head() 46.5 44.2 100.0 42.12 Voglio vedere la colonna come conteggio bin: bins = [0, 1, 5, 10, 25, 50, 100] Come posso ottenere il risultato come bidoni con loro value counts? [0, 1] bin amount [1, 5] etc [5, 10] etc …

5
come cambiare una colonna Dataframe dal tipo String al tipo Double in pyspark
Ho un dataframe con colonna come String. Volevo cambiare il tipo di colonna in Double type in PySpark. Di seguito è il modo, ho fatto: toDoublefunc = UserDefinedFunction(lambda x: x,DoubleType()) changedTypedf = joindf.withColumn("label",toDoublefunc(joindf['show'])) Volevo solo sapere, è questo il modo giusto per farlo poiché durante la regressione logistica, ricevo un …

10
Filtra la colonna del dataframe Pyspark con il valore Nessuno
Sto cercando di filtrare un dataframe PySpark che ha Nonecome valore di riga: df.select('dt_mvmt').distinct().collect() [Row(dt_mvmt=u'2016-03-27'), Row(dt_mvmt=u'2016-03-28'), Row(dt_mvmt=u'2016-03-29'), Row(dt_mvmt=None), Row(dt_mvmt=u'2016-03-30'), Row(dt_mvmt=u'2016-03-31')] e posso filtrare correttamente con un valore stringa: df[df.dt_mvmt == '2016-03-31'] # some results here ma questo fallisce: df[df.dt_mvmt == None].count() 0 df[df.dt_mvmt != None].count() 0 Ma ci sono sicuramente …

6
Converti frame di dati panda in serie
Sono un po 'nuovo per i panda. Ho un frame di dati panda che è 1 riga per 23 colonne. Voglio convertirlo in una serie? Mi chiedo qual è il modo più pitonico per farlo? Ho provato pd.Series(myResults)ma si lamentaValueError: cannot copy sequence with size 23 to array axis with …






5
Sostituisci tutti i valori particolari in un data frame
Avendo un data frame, come posso sostituire tutti i valori particolari lungo tutte le righe e le colonne. Supponiamo ad esempio che voglia sostituire tutti i record vuoti con NA's (senza digitare le posizioni): df <- data.frame(list(A=c("", "xyz", "jkl"), B=c(12, "", 100))) A B 1 12 2 xyz 3 jkl …
96 r  dataframe  replace 

3
Annota le barre con i valori sui grafici delle barre di Panda
Stavo cercando un modo per annotare le mie barre in un grafico a barre di Panda con i valori numerici arrotondati dal mio DataFrame. >>> df=pd.DataFrame({'A':np.random.rand(2),'B':np.random.rand(2)},index=['value1','value2'] ) >>> df A B value1 0.440922 0.911800 value2 0.588242 0.797366 Vorrei ottenere qualcosa di simile a questo: Ho provato con questo esempio di …

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.