Utilizzare per domande sulla scienza dei dati relative al linguaggio di programmazione Python. Non destinato a domande di codifica generali (-> stackoverflow).
Ho un Pandas DataFrame come questo: df = pd.DataFrame({ 'Date': ['2017-1-1', '2017-1-1', '2017-1-2', '2017-1-2', '2017-1-3'], 'Groups': ['one', 'one', 'one', 'two', 'two'], 'data': range(1, 6)}) Date Groups data 0 2017-1-1 one 1 1 2017-1-1 one 2 2 2017-1-2 one 3 3 2017-1-2 two 4 4 2017-1-3 two 5 Come posso generare …
Ho telai 10 di dati pyspark.sql.dataframe.DataFrame, ottenuti da randomSplitcome (td1, td2, td3, td4, td5, td6, td7, td8, td9, td10) = td.randomSplit([.1, .1, .1, .1, .1, .1, .1, .1, .1, .1], seed = 100)Ora voglio unire 9 td's in un singolo frame di dati, come devo fare? Ho già provato con …
Abbastanza nuovo su Python ma costruendo il mio primo modello RF basato su alcuni dati di classificazione. Ho convertito tutte le etichette in dati numerici int64 e caricato in X e Y come una matrice numpy, ma sto provando un errore quando provo ad addestrare i modelli. Ecco come appaiono …
Stavo esaminando la documentazione ufficiale di scikit-learn learn dopo aver letto un libro su ML e mi sono imbattuto nella seguente cosa: Nella Documentazione è data sklearn.preprocessing.OrdinalEncoder()mentre mentre nel libro è stata data sklearn.preprocessing.LabelEncoder(), quando ho verificato la loro funzionalità mi è sembrato lo stesso. Qualcuno può dirmi la differenza …
Sono un po 'confuso nella scelta tra Keras (keras-team / keras) e tf.keras (tensorflow / tensorflow / python / keras /) per il mio nuovo progetto di ricerca. C'è un dibattito sul fatto che Keras non sia di proprietà di nessuno, quindi le persone sono più felici di contribuire e …
Ho una domanda di base che riguarda Python, intorpidimento e moltiplicazione delle matrici nel contesto della regressione logistica. Prima di tutto, vorrei scusarmi per non aver usato la notazione matematica. Sono confuso sull'uso della moltiplicazione dei punti matrice rispetto alla moltiplicazione saggia degli elementi. La funzione di costo è data …
Chiuso . Questa domanda richiede dettagli o chiarezza . Al momento non accetta risposte. Vuoi migliorare questa domanda? Aggiungi dettagli e chiarisci il problema modificando questo post . Chiuso 3 anni fa . Sto lavorando a un set di dati di fantasia con 25 funzionalità. Due delle caratteristiche sono la …
Sto lavorando a una sfida di Kaggle in cui alcune variabili sono rappresentate da righe anziché da colonne (interruzione della rete Telstra). Attualmente sto cercando l'equivalente di gather (), separate () e spread (), che si trova nello strumento R tidyr.
Da Keras RNN Tutorial: "Gli RNN sono difficili. La scelta della dimensione del batch è importante, la scelta della perdita e l'ottimizzatore sono fondamentali, ecc. Alcune configurazioni non convergono." Quindi questa è più una domanda generale sull'ottimizzazione degli iperparametri di un LSTM-RNN su Keras. Vorrei sapere un approccio per trovare …
Nella mia classe devo creare un'applicazione usando due classificatori per decidere se un oggetto in un'immagine è un esempio di phylum porifera (spugna di mare) o qualche altro oggetto. Tuttavia, mi sono completamente perso quando si tratta di tecniche di estrazione in Python. Il mio consulente mi ha convinto a …
Vorrei ridurre la dimensionalità su quasi 1 milione di vettori ciascuno con 200 dimensioni ( doc2vec). Sto usando l' TSNEimplementazione dal sklearn.manifoldmodulo per questo e il problema principale è la complessità temporale. Anche con method = barnes_hut, la velocità di calcolo è ancora bassa. Qualche volta anche la memoria si …
Sto lavorando al riconoscimento vocale con Tensorflow e sto pianificando di addestrare LSTM NN con un set di dati ad onde enormi. A causa degli aumenti delle prestazioni, ho intenzione di utilizzare tfrecords. Ci sono molti esempi su Internet (Inception per es.) In cui i file di tfrecords sono divisi …
Esiste un pacchetto open source completo (preferibilmente in Python o R) che può essere utilizzato per il rilevamento di anomalie nelle serie temporali? Esiste un pacchetto SVM di una classe in scikit-learn ma non è per i dati di serie temporali. Sto cercando pacchetti più sofisticati che, ad esempio, utilizzano …
Qualcuno può pubblicare un semplice esempio di Keras usando un callback per salvare un modello dopo ogni epoca? Posso trovare esempi di risparmio di pesi, ma voglio essere in grado di salvare un modello completamente funzionante dopo ogni epoca di allenamento.
Come posso ottenere il numero di valore mancante in ogni riga nel frame di dati di Pandas. Vorrei dividere i frame di dati in frame di dati diversi che hanno lo stesso numero di valori mancanti in ogni riga. Qualche suggerimento?
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.