Utilizzare per domande sulla scienza dei dati relative al linguaggio di programmazione Python. Non destinato a domande di codifica generali (-> stackoverflow).
Sto creando un flusso di lavoro per la creazione di modelli di machine learning (nel mio caso, usando Python pandase sklearnpacchetti) da dati estratti da un database molto grande (qui, Vertica tramite SQL e pyodbc), e un passaggio fondamentale in questo processo prevede l'imputazione mancante valori dei predittori. Questo è …
Sto cercando di creare un sistema di raccomandazioni utilizzando il filtro collaborativo. Ho le solite [user, movie, rating]informazioni. Vorrei incorporare una funzionalità aggiuntiva come "lingua" o "durata del film". Non sono sicuro di quali tecniche potrei usare per un tale problema. Si prega di suggerire riferimenti o pacchetti in python …
Sto lavorando per migliorare un classificatore supervisionato esistente, per classificare le sequenze di {proteine} come appartenenti a una classe specifica (precursori dell'ormone neuropeptide) o no. Esistono circa 1.150 "positivi" noti, su uno sfondo di circa 13 milioni di sequenze di proteine ("Sfondo sconosciuto / scarsamente annotato"), o circa 100.000 proteine …
Ho riscontrato un problema di classificazione e ho letto il codice e le esercitazioni di molte persone. Una cosa che ho notato è che molte persone prendono np.logo logdi variabili continue come loan_amounto applicant_incomeecc. Voglio solo capire il motivo dietro. Aiuta a migliorare la precisione della previsione del nostro modello. …
Creo un corr()df da un df originale. Il corr()df è venuto fuori 70 X 70 ed è impossibile visualizzare il heatmap ... sns.heatmap(df). Se provo a visualizzare il corr = df.corr(), la tabella non si adatta allo schermo e posso vedere tutte le correlazioni. È un modo per stampare l'intero …
Nel blog di Keras sulle reti di addestramento da zero , il codice mostra solo la rete in esecuzione sui dati di addestramento e convalida. E i dati dei test? I dati di validazione sono gli stessi dei dati di test (penso di no). Se esiste una cartella di test …
https://github.com/Rdatatable/data.table/wiki/Benchmarks-%3A-Grouping I benchmark data.table non sono stati aggiornati dal 2014. Ho sentito da qualche parte che Pandasora è più veloce di data.table. È vero? Qualcuno ha fatto dei benchmark? Non ho mai usato Python prima, ma prenderei in considerazione il passaggio se pandasposso battere data.table?
Quale libreria Python stabile posso usare per implementare i modelli nascosti di Markov? Ho bisogno che sia ragionevolmente ben documentato, perché non ho mai usato questo modello prima d'ora. In alternativa, esiste un approccio più diretto per eseguire un'analisi delle serie temporali su un set di dati utilizzando HMM?
Sto cercando di risolvere il seguente problema: ho un set di frasi come set di dati e voglio essere in grado di digitare una nuova frase e trovare la frase che la nuova è la più simile a quella nel set di dati. Un esempio potrebbe apparire come: Nuova frase: …
Spero che questa domanda sia la più adatta in questo sito ... In Python, di solito il nome della classe viene definito usando la lettera maiuscola come primo carattere, ad esempio class Vehicle: ... Tuttavia, nel campo dell'apprendimento automatico, spesso i dati di treno e test sono definiti come Xe …
Uso Python per eseguire un modello di foresta casuale sul mio set di dati non bilanciato (la variabile di destinazione era una classe binaria). Quando ho diviso il set di dati di training e testing, ho faticato a usare il campionamento stratificato (come il codice mostrato) oppure no. Finora, ho …
Ho un set di dati con le seguenti specifiche: Set di dati di addestramento con 193.176 campioni con 2.821 positivi Set di dati di prova con 82.887 campioni con 673 positivi Ci sono 10 funzioni. Voglio eseguire una classificazione binaria (0 o 1). Il problema che sto affrontando è che …
Lavoro in un ufficio in cui SQL Server è la spina dorsale di tutto ciò che facciamo, dall'elaborazione dei dati alla pulizia fino alla pulizia. Il mio collega è specializzato nella scrittura di funzioni complesse e procedure memorizzate per elaborare metodicamente i dati in entrata in modo che possano essere …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.