Domande taggate «scikit-learn»

scikit-learn è una libreria di machine learning per Python che fornisce strumenti semplici ed efficienti per l'analisi dei dati e il data mining, con particolare attenzione all'apprendimento automatico. È accessibile a tutti e riutilizzabile in vari contesti. È costruito su NumPy e SciPy. Il progetto è open source e utilizzabile commercialmente (licenza BSD).

20
Etichetta la codifica su più colonne in scikit-learn
Sto cercando di usare Scikit-Learn LabelEncoderper codificare un panda DataFramedi etichette di stringa. Poiché il dataframe ha molte (50+) colonne, voglio evitare di creare un LabelEncoderoggetto per ogni colonna; Preferirei avere solo un LabelEncoderoggetto grande che funzioni su tutte le mie colonne di dati. Lanciare l'intero DataFramein LabelEncodercrea l'errore di …


6
Salva classificatore su disco in scikit-learn
Come posso salvare un classificatore Naive Bayes addestrato su disco e utilizzarlo per prevedere i dati? Ho il seguente programma di esempio dal sito Web di scikit-learn: from sklearn import datasets iris = datasets.load_iris() from sklearn.naive_bayes import GaussianNB gnb = GaussianNB() y_pred = gnb.fit(iris.data, iris.target).predict(iris.data) print "Number of mislabeled points …

15
ImportError: nessun modulo denominato sklearn.cross_validation
Sto usando Python 2.7 in Ubuntu 14.04. Ho installato scikit-learn, numpy e matplotlib con questi comandi: sudo apt-get install build-essential python-dev python-numpy \ python-numpy-dev python-scipy libatlas-dev g++ python-matplotlib \ ipython Ma quando importare questi pacchetti: from sklearn.cross_validation import train_test_split Mi restituisce questo errore: ImportError: No module named sklearn.cross_validation Cosa devo …









13
errore di sklearn ValueError: l'input contiene NaN, infinity o un valore troppo grande per dtype ('float64')
Sto usando sklearn e ho un problema con la propagazione dell'affinità. Ho costruito una matrice di input e continuo a ricevere il seguente errore. ValueError: Input contains NaN, infinity or a value too large for dtype('float64'). Ho corso np.isnan(mat.any()) #and gets False np.isfinite(mat.all()) #and gets True Ho provato a usare …

3
Perché una codifica a caldo migliora le prestazioni di apprendimento automatico?
Ho notato che quando la codifica One Hot viene utilizzata su un particolare set di dati (una matrice) e utilizzata come dati di allenamento per algoritmi di apprendimento, si ottengono risultati significativamente migliori rispetto all'accuratezza della previsione, rispetto all'utilizzo della matrice originale stessa come dati di allenamento. Come avviene questo …


Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.