Utilizzare per domande sulla scienza dei dati relative al linguaggio di programmazione Python. Non destinato a domande di codifica generali (-> stackoverflow).
Supponiamo di avere il seguente frame di dati con più valori per una determinata colonna: categories 0 - ["A", "B"] 1 - ["B", "C", "D"] 2 - ["B", "D"] Come possiamo ottenere un tavolo come questo? "A" "B" "C" "D" 0 - 1 1 0 0 1 - 0 1 …
Problema Ho provato a usare Naive Bayes su una serie di dati etichettati di dati sulla criminalità, ma ho ottenuto risultati davvero scarsi (precisione del 7%). Naive Bayes corre molto più velocemente degli altri alogoritmi che ho usato, quindi volevo provare a scoprire perché il punteggio era così basso. Ricerca …
Voglio usare Latent Dirichlet Allocation per un progetto e sto usando Python con la libreria gensim. Dopo aver trovato gli argomenti, vorrei raggruppare i documenti usando un algoritmo come k-mean (idealmente vorrei usarne uno buono per i cluster sovrapposti, quindi ogni raccomandazione è benvenuta). Sono riuscito a ottenere gli argomenti, …
Poiché il metodo interpolare e fillna fa lo stesso lavoro di riempimento di valori na. Qual è la differenza di base tra i due. Qual è il significato di avere questi due diversi metodi ?? Qualcuno può spiegarmi in termini laici. Ho già visitato la documentazione ufficiale e volevo sapere …
Ho un set di dati con 19 colonne e circa 250k righe. Ho lavorato con set di dati più grandi, ma questa volta Pandas ha deciso di giocare con i miei nervi. Ho provato a dividere il set di dati originale in 3 sub-frame di dati basati su alcune semplici …
Gli esperti nel mio campo sono in grado di prevedere la probabilità che un evento (picco binario in giallo) 30 minuti prima che si verifichi . La frequenza qui è di 1 secondo, questa vista rappresenta alcune ore di dati, ho cerchiato in nero dove dovrebbe essere il modello "malizioso" …
Ho un set di dati per il quale sto cercando di prevedere le variabili target. Col1 Col2 Col3 Col4 Col5 1 2 23 11 1 2 22 12 14 1 22 11 43 38 3 14 22 25 19 3 12 42 11 14 1 22 11 43 38 2 …
Quando salvato su disco usando cPickle: /programming/20662023/save-python-random-forest-model-to-file , la mia foresta casuale è di 6.57 GB. with open('rforest.cpickle', 'wb') as f: cPickle.dump(rforest, f) Voglio usare la foresta stessa per fare previsioni tramite un'API python ospitata su Heroku - ovviamente, la dimensione del file è inaccettabile. Perché la dimensione del file …
Sto usando la libreria Seaborn per generare grafici a barre in Python. Mi chiedo quali statistiche vengono utilizzate per calcolare le barre di errore, ma non riesco a trovare alcun riferimento a questo nella documentazione del grafico a barre del Seaborn . So che i valori della barra sono calcolati …
Mentre aumenta il numero di alberi in scikit imparare s' GradientBoostingRegressor, ho previsioni più negative, anche se non ci sono valori negativi nella mia formazione e testing set. Ho circa 10 funzioni, la maggior parte delle quali binarie. Alcuni dei parametri che stavo sintonizzando erano: il numero di alberi / …
Chiuso . Questa domanda deve essere più focalizzata . Al momento non accetta risposte. Vuoi migliorare questa domanda? Aggiorna la domanda in modo che si concentri su un problema solo modificando questo post . Chiuso 2 anni fa . nella mia attività gestiamo tutte le analisi tramite Excel. Ciò include …
Chiuso. Questa domanda è fuori tema . Al momento non accetta risposte. Vuoi migliorare questa domanda? Aggiorna la domanda in modo che sia in argomento per lo scambio di stack di Data Science. Chiuso 2 anni fa . Vorrei eliminare tutte le righe contenenti valori NaN relativi a una colonna. …
Sto cercando di rilevare alcune anomalie tra le serie storiche # usando Python e sklearn (ma altri suggerimenti di pacchetti sono sicuramente benvenuti!). Ho un set di 10 serie storiche; ogni serie temporale è costituita dai dati raccolti dal valore di coppia di uno pneumatico (quindi 10 pneumatici in totale) …
Voglio fare previsioni un passo avanti per le serie storiche con LSTM. Per capire l'algoritmo, mi sono costruito un esempio giocattolo: un semplice processo correlato automaticamente. def my_process(n, p, drift=0, displacement=0): x = np.zeros(n) for i in range(1, n): x[i] = drift * i + p * x[i-1] + (1-p) …
Di recente ho imparato come funzionerebbe una rete neurale vanilla, con un determinato numero di input, nodi nascosti e lo stesso numero di output degli input. Ho esaminato vari post ora correlati alla rete neurale ricorrente e capisco il concetto alla base, ma non riesco a capire alcune parti della …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.