Una libreria di apprendimento automatico per Python. Usa questo tag per qualsiasi domanda sull'argomento che (a) coinvolga scikit-learn come parte critica della domanda o risposta prevista, e (b) non riguarda solo come usare scikit-learn.
Come ho capito, k-NN è un algoritmo di studente pigro e non ha bisogno di una fase di allenamento. Quindi perché dobbiamo usare .fit()con sklearn e cosa succede quando lo usiamo?
Il mgcvpacchetto per Rha due funzioni per adattare le interazioni del prodotto tensore: te()e ti(). Comprendo la divisione di base del lavoro tra i due (adattamento di un'interazione non lineare rispetto alla scomposizione di questa interazione in effetti principali e un'interazione). Quello che non capisco è perché te(x1, x2)e ti(x1) …
Questa è la funzione di perdita di deviazione binomiale di GradientBoosting di scikit, def __call__(self, y, pred, sample_weight=None): """Compute the deviance (= 2 * negative log-likelihood). """ # logaddexp(0, v) == log(1.0 + exp(v)) pred = pred.ravel() if sample_weight is None: return -2.0 * np.mean((y * pred) - np.logaddexp(0.0, pred)) …
Sto lavorando allo sviluppo di un modello predittivo del rischio assicurativo. Questi modelli sono di "eventi rari" come la previsione del no-show delle compagnie aeree, il rilevamento di guasti hardware, ecc. Mentre preparavo il mio set di dati, ho cercato di applicare la classificazione, ma non sono riuscito a ottenere …
Sto cercando di capire come riprodurre in Python alcuni lavori che ho svolto in SAS. Utilizzando questo set di dati , in cui la multicollinearità è un problema, vorrei eseguire l'analisi dei componenti principali in Python. Ho esaminato scikit-learn e statsmodels, ma non sono sicuro di come ottenere il loro …
Di recente ho imparato a conoscere il meraviglioso PCA e ho fatto l'esempio delineato nella documentazione di scikit-learn . Sono interessato a sapere come posso applicare PCA a nuovi punti dati a fini di classificazione. Dopo aver visualizzato PCA su un piano bidimensionale (asse x, y), vedo che probabilmente posso …
Scikit Learn sembra usare la previsione probabilistica invece del voto della maggioranza per la tecnica di aggregazione del modello senza una spiegazione del perché (1.9.2.1. Foreste casuali). C'è una chiara spiegazione del perché? Inoltre, esiste un buon articolo o articolo di revisione per le varie tecniche di aggregazione dei modelli …
Attualmente sto usando Scikit Learn con il seguente codice: clf = svm.SVC(C=1.0, tol=1e-10, cache_size=600, kernel='rbf', gamma=0.0, class_weight='auto') e quindi adattarsi e prevedere un set di dati con 7 etichette diverse. Ho ottenuto un risultato strano. Indipendentemente dalla tecnica di convalida incrociata che utilizzo l'etichetta prevista sul set di convalida sarà …
Sto lavorando su un set di dati. Dopo aver usato alcune tecniche di identificazione del modello, sono uscito con un modello ARIMA (0,2,1). Ho usato la detectIOfunzione nel pacchetto TSAin R per rilevare un valore anomalo innovativo (IO) alla 48a osservazione del mio set di dati originale. Come posso incorporare …
Ho esaminato la documentazione di sklearn ma non sono in grado di comprendere lo scopo di queste funzioni nel contesto della regressione logistica. Perché decision_functiondice che è la distanza tra l'iperpiano e l'istanza di test. come sono utili queste informazioni particolari? e in che modo ciò si collega predicte predict-probametodi?
Sto cercando di valutare le prestazioni del clustering. Stavo leggendo la documentazione di skiscit-learn sulle metriche . Non capisco la differenza tra ARI e AMI. Mi sembra che facciano la stessa cosa in due modi diversi. Citando dalla documentazione: Data la conoscenza delle assegnazioni della classe di verità di base …
Ecco il mio codice per il metodo di selezione delle funzionalità in Python: from sklearn.svm import LinearSVC from sklearn.datasets import load_iris iris = load_iris() X, y = iris.data, iris.target X.shape (150, 4) X_new = LinearSVC(C=0.01, penalty="l1", dual=False).fit_transform(X, y) X_new.shape (150, 3) Ma dopo aver ottenuto la nuova X (variabile dipendente …
Sto cercando di capire se la mia comprensione della convalida incrociata nidificata è corretta, quindi ho scritto questo esempio di giocattolo per vedere se ho ragione: import operator import numpy as np from sklearn import cross_validation from sklearn import ensemble from sklearn.datasets import load_boston # set random state state = …
Non ho trovato alcuna documentazione sull'applicazione di Random Forests a MNIST, CIFAR, STL-10, ecc. Quindi ho pensato di provarli con il MNIST invariante alla permutazione . In R , ho provato: randomForest(train$x, factor(train$y), test$x, factor(test$y), ntree=500) Questo ha funzionato per 2 ore e ha avuto un errore di prova del …
Sto cercando di adattare un modello a tempo discreto in R, ma non sono sicuro di come farlo. Ho letto che puoi organizzare la variabile dipendente in diverse righe, una per ogni osservazione temporale e utilizzare la glmfunzione con un collegamento logit o cloglog. In questo senso, ho tre colonne: …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.