Come recuperare a livello di codice il numero di colonne in un frame di dati Panda? Speravo in qualcosa del tipo:
df.num_columns
Come recuperare a livello di codice il numero di colonne in un frame di dati Panda? Speravo in qualcosa del tipo:
df.num_columns
Risposte:
Così:
import pandas as pd
df = pd.DataFrame({"pear": [1,2,3], "apple": [2,3,4], "orange": [3,4,5]})
len(df.columns)
3
df.shape
è meglio? la mia ipotesi è che non chiama una funzione ma legge solo l'attributo dalla memoria?
Alternativa:
df.shape[1]
( df.shape[0]
è il numero di righe)
Se la variabile che contiene il dataframe si chiama df, allora:
len(df.columns)
indica il numero di colonne.
E per chi desidera il numero di righe:
len(df.index)
Per una tupla contenente il numero di righe e colonne:
df.shape
len(df)
darebbe le file?
Questo ha funzionato per me len (list (df)).
La funzione df.info () ti darà risultati simili a quelli indicati di seguito. Se si utilizza il metodo read_csv di Panda senza parametro sep o sep con ",".
raw_data = pd.read_csv("a1:\aa2/aaa3/data.csv")
raw_data.info()
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 5144 entries, 0 to 5143
Columns: 145 entries, R_fighter to R_age
Ci sono più opzioni per ottenere il numero di colonna e le informazioni sulla colonna come:
controlliamo.
local_df = pd.DataFrame (np.random.randint (1,12, size = (2,6)), colonne = ['a', 'b', 'c', 'd', 'e', 'f ']) 1. local_df.shape [1] -> Attributo forma restituisce tupla come (riga e colonne) (0,1).
local_df.info () -> Il metodo info restituirà informazioni dettagliate sul frame di dati e le sue colonne come conteggio delle colonne, tipo di dati delle colonne, conteggio del valore non nullo, utilizzo della memoria da parte del frame di dati
len (local_df.columns) -> l'attributo colonne restituirà l'oggetto indice delle colonne del frame di dati e la funzione len restituirà il totale delle colonne disponibili.
local_df.head (0) -> Il metodo head con il parametro 0 restituirà la prima riga di df che in realtà non è altro che intestazione.
Supponendo che il numero di colonne non sia superiore a 10. Per divertimento in loop: li_count = 0 per x in local_df: li_count = li_count + 1 stampa (li_count)
df.shape
dà una tupla con (n_rows, n_columns)