Scikit-learn è un modulo Python composto da uno strumento semplice ed efficiente per l'apprendimento automatico, il data mining e l'analisi dei dati. È basato su NumPy, SciPy e matplotlib. È distribuito sotto la licenza BSD a 3 clausole.
Sono un principiante della scienza dei dati e non capisco la differenza tra fite i fit_transformmetodi di scikit-learn. Qualcuno può semplicemente spiegare perché potremmo aver bisogno di trasformare i dati? Che cosa significa adattamento del modello ai dati di allenamento e trasformazione in dati di test? Significa, ad esempio, convertire …
Ho creato modelli con dati categorici per un po 'di tempo e quando in questa situazione fondamentalmente non utilizzo la funzione LabelEncoder di scikit-learn per trasformare questi dati prima di creare un modello. Capisco la differenza tra OHE, LabelEncodere DictVectorizorin termini di ciò che stanno facendo per i dati, ma …
Sto cercando di eseguire SVR usando scikit learn (python) su un set di dati di allenamento con 595605 righe e 5 colonne (caratteristiche) e test set di dati con 397070 righe. I dati sono stati pre-elaborati e regolarizzati. Sono in grado di eseguire correttamente gli esempi di test, ma eseguendo …
Sto riscontrando alcuni problemi su un'applicazione dell'albero decisionale / foresta casuale. Sto cercando di adattare un problema che ha numeri e stringhe (come il nome del paese) come funzionalità. Ora la libreria, scikit-learn prende solo i numeri come parametri, ma voglio iniettare le stringhe oltre a portare una notevole quantità …
Come potrei dividere casualmente una matrice di dati e il corrispondente vettore di etichetta in X_train, X_test, X_val, y_train, y_test, y_val con Sklearn? Per quanto ne so, sklearn.cross_validation.train_test_splitè solo in grado di dividersi in due, non in tre ...
Sto lavorando al problema con troppe funzioni e la formazione dei miei modelli richiede troppo tempo. Ho implementato l'algoritmo di selezione diretta per scegliere le funzionalità. Tuttavia, mi chiedevo scikit-learn ha algoritmo di selezione in avanti / regressione graduale?
Sto cercando di formare un modello di aumento gradiente su 50.000 esempi con 100 funzioni numeriche. XGBClassifiergestisce 500 alberi entro 43 secondi sulla mia macchina, mentre GradientBoostingClassifiergestisce solo 10 alberi (!) in 1 minuto e 2 secondi :( Non mi sono preoccupato di provare a far crescere 500 alberi perché …
Sto seguendo questo esempio sul sito Web di scikit-learn per eseguire una classificazione multioutput con un modello Random Forest. from sklearn.datasets import make_classification from sklearn.multioutput import MultiOutputClassifier from sklearn.ensemble import RandomForestClassifier from sklearn.utils import shuffle import numpy as np X, y1 = make_classification(n_samples=5, n_features=5, n_informative=2, n_classes=2, random_state=1) y2 = shuffle(y1, …
Sto usando una regressione lineare standard usando scikit-learn in Python. Tuttavia, vorrei forzare i pesi a essere tutti positivi per ogni caratteristica (non negativa), c'è un modo per riuscirci? Stavo cercando nella documentazione ma non riuscivo a trovare un modo per farlo. Capisco che potrei non ottenere la soluzione migliore, …
Un modo per addestrare una regressione logistica consiste nell'utilizzare la discesa graduale stocastica, a cui scikit-learn offre un'interfaccia. Quello che vorrei fare è prendere un SGDClassifier di scikit-learn e farlo segnare come una regressione logistica qui . Tuttavia, devo mancare alcuni miglioramenti dell'apprendimento automatico, poiché i miei punteggi non sono …
Sono piuttosto nuovo in questo e non posso dire di avere una completa comprensione dei concetti teorici alla base di questo. Sto cercando di calcolare la divergenza KL tra diversi elenchi di punti in Python. Sto usando http://scikit-learn.org/stable/modules/generated/sklearn.metrics.mutual_info_score.html per provare a farlo. Il problema che sto incontrando è che il …
Abbastanza nuovo su Python ma costruendo il mio primo modello RF basato su alcuni dati di classificazione. Ho convertito tutte le etichette in dati numerici int64 e caricato in X e Y come una matrice numpy, ma sto provando un errore quando provo ad addestrare i modelli. Ecco come appaiono …
Stavo esaminando la documentazione ufficiale di scikit-learn learn dopo aver letto un libro su ML e mi sono imbattuto nella seguente cosa: Nella Documentazione è data sklearn.preprocessing.OrdinalEncoder()mentre mentre nel libro è stata data sklearn.preprocessing.LabelEncoder(), quando ho verificato la loro funzionalità mi è sembrato lo stesso. Qualcuno può dirmi la differenza …
Quando stavo leggendo sull'uso StandardScaler, la maggior parte dei consigli dicevano che dovresti usare StandardScaler prima di suddividere i dati in treno / test, ma quando stavo controllando alcuni dei codici pubblicati online (usando sklearn) c'erano due usi principali. 1- Utilizzo StandardScalersu tutti i dati. Per esempio from sklearn.preprocessing import …
Sto costruendo una regressione logistica multinomiale con sklearn (LogisticRegression). Ma al termine, come posso ottenere un valore p e un intervallo sicuro del mio modello? Sembra solo che sklearn fornisca solo coefficiente e intercetta. Grazie mille.
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.