Voglio applicare la mia funzione personalizzata (che utilizza una scala if-else) per questi sei colonne ( ERI_Hispanic, ERI_AmerInd_AKNatv, ERI_Asian, ERI_Black_Afr.Amer, ERI_HI_PacIsl, ERI_White) in ogni riga della mia dataframe. Ho provato metodi diversi da altre domande ma non riesco ancora a trovare la risposta giusta al mio problema. Il pezzo critico …
Chiuso. Questa domanda non è riproducibile o è stata causata da errori di battitura . Al momento non accetta risposte. Vuoi migliorare questa domanda? Aggiorna la domanda in modo che sia in argomento per StackTranslate.it. Chiuso l'anno scorso . Migliora questa domanda Ho alcuni problemi con la funzione di applicazione …
... per quanto riguarda i tempi di esecuzione e / o la memoria. Se ciò non è vero, dimostralo con uno snippet di codice. Si noti che l'accelerazione mediante vettorializzazione non conta. L'aumento di velocità deve venire da apply( tapply, sapply, ...) stesso.
Sto riscontrando problemi con un frame di dati e non riesco davvero a risolvere il problema da solo: il dataframe ha proprietà arbitrarie come colonne e ogni riga rappresenta un set di dati . La domanda è: come sbarazzarsi delle colonne in cui per TUTTE le righe il valore è …
Voglio applicare una funzione con argomenti a una serie in python panda: x = my_series.apply(my_function, more_arguments_1) y = my_series.apply(my_function, more_arguments_2) ... La documentazione descrive il supporto per un metodo apply, ma non accetta alcun argomento. Esiste un metodo diverso che accetta argomenti? In alternativa, mi sto perdendo una semplice soluzione? …
Quindi siamo abituati a dire a ogni nuovo utente R che " applynon è vettoriale, controlla il Patrick Burns R Inferno Circle 4 " che dice (cito): Un riflesso comune è usare una funzione nella famiglia di applicazione. Questa non è vettorializzazione, si nasconde in loop . La funzione apply …
Supponiamo di avere una matrice per 2 e una funzione che accetta un 2-vettore come uno dei suoi argomenti. Vorrei applicare la funzione a ciascuna riga della matrice e ottenere un vettore n. Come farlo in R? Ad esempio, vorrei calcolare la densità di una distribuzione Normale standard 2D su …
Ho visto molte risposte pubblicate a domande su Stack Overflow che coinvolgono l'uso del metodo Pandas apply. Ho anche visto utenti commentare sotto di loro dicendo che " applyè lento e dovrebbe essere evitato". Ho letto molti articoli sull'argomento delle prestazioni che spiegano applyè lento. Ho anche visto un disclaimer …
Ho un panda dataframe, df_test. Contiene una colonna "size" che rappresenta la dimensione in byte. Ho calcolato KB, MB e GB utilizzando il seguente codice: df_test = pd.DataFrame([ {'dir': '/Users/uname1', 'size': 994933}, {'dir': '/Users/uname2', 'size': 109338711}, ]) df_test['size_kb'] = df_test['size'].astype(int).apply(lambda x: locale.format("%.1f", x / 1024.0, grouping=True) + ' KB') df_test['size_mb'] …
Ho un dataframe che potrebbe assomigliare a questo: A B C foo bar foo bar bar foo foo bar Voglio esaminare ogni elemento di ogni riga (o ogni elemento di ogni colonna) e applicare la seguente funzione per ottenere il DF successivo: def foo_bar(x): return x.replace('foo', 'wow') A B C …
So che i loop sono lenti Re che invece dovrei provare a fare le cose in modo vettorializzato. Ma perché? Perché i loop sono lenti ed applyè veloce? applychiama diverse sotto-funzioni: non sembra veloce. Aggiornamento: mi dispiace, la domanda era mal posta. Stavo confondendo la vettorizzazione con apply. La mia …
La documentazione dice vapplyè simile a sapply, ma ha un tipo di valore di ritorno pre-specificato, quindi può essere [...] più sicuro da usare. Potresti spiegare perché è generalmente più sicuro, magari fornendo degli esempi? PS: conosco la risposta e già tendo ad evitare sapply. Vorrei solo che ci fosse …
Ho un tale DataFrame: df = pd.DataFrame(data={ 'col0': [11, 22,1, 5] 'col1': ['aa:a:aaa', 'a:a', 'a', 'a:aa:a:aaa'], 'col2': ["foo", "foo", "foobar", "bar"], 'col3': [True, False, True, False], 'col4': ['elo', 'foo', 'bar', 'dupa']}) Voglio ottenere la lunghezza della lista dopo aver diviso ":" in col1, quindi voglio sovrascrivere i valori se lunghezza> …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.