Domande taggate «scikit-learn»

Scikit-learn è un modulo Python composto da uno strumento semplice ed efficiente per l'apprendimento automatico, il data mining e l'analisi dei dati. È basato su NumPy, SciPy e matplotlib. È distribuito sotto la licenza BSD a 3 clausole.

3
Relazione tra convoluzione in matematica e CNN
Ho letto la spiegazione della convoluzione e la capisco fino a un certo punto. Qualcuno può aiutarmi a capire come questa operazione si collega alla convoluzione nelle reti neurali convoluzionali? È una funzione simile a un filtro gche applica peso?
10 machine-learning  neural-network  deep-learning  cnn  convolution  machine-learning  ensemble-modeling  machine-learning  classification  data-mining  clustering  machine-learning  feature-selection  convnet  pandas  graphs  ipython  machine-learning  apache-spark  multiclass-classification  naive-bayes-classifier  multilabel-classification  machine-learning  data-mining  dataset  data-cleaning  data  machine-learning  data-mining  statistics  correlation  machine-learning  data-mining  dataset  data-cleaning  data  beginner  career  python  r  visualization  machine-learning  data-mining  nlp  stanford-nlp  dataset  linear-regression  time-series  correlation  anomaly-detection  ensemble-modeling  data-mining  machine-learning  python  data-mining  recommender-system  machine-learning  cross-validation  model-selection  scoring  prediction  sequential-pattern-mining  categorical-data  python  tensorflow  image-recognition  statistics  machine-learning  data-mining  predictive-modeling  data-cleaning  preprocessing  classification  deep-learning  tensorflow  machine-learning  algorithms  data  keras  categorical-data  reference-request  loss-function  classification  logistic-regression  apache-spark  prediction  naive-bayes-classifier  beginner  nlp  word2vec  vector-space-models  scikit-learn  decision-trees  data  programming 

3


1
Dati squilibrati che causano una classificazione errata nel set di dati multiclasse
Sto lavorando alla classificazione del testo in cui ho 39 categorie / classi e 8,5 milioni di record. (In futuro aumenteranno i dati e le categorie). La struttura o il formato dei miei dati è il seguente. ---------------------------------------------------------------------------------------- | product_title | Key_value_pairs | taxonomy_id | ---------------------------------------------------------------------------------------- Samsung S7 Edge | …

4
Interpretazione dell'albero delle decisioni nel contesto dell'importanza delle funzioni
Sto cercando di capire come comprendere appieno il processo decisionale di un modello di classificazione dell'albero decisionale creato con sklearn. I 2 aspetti principali che sto guardando sono una rappresentazione grafica dell'albero e l'elenco delle importazioni delle funzionalità. Quello che non capisco è come viene determinata l'importanza della funzione nel …


1
Selezione delle funzioni per Support Vector Machines
La mia domanda è triplice Nel contesto di macchine vettoriali di supporto "Kernelized" È desiderabile la selezione di variabili / funzionalità, soprattutto perché regolarizziamo il parametro C per evitare un eccesso di adattamento e il motivo principale dietro l'introduzione di kernel in un SVM è quello di aumentare la dimensionalità …


1
La fiducia nell'etichetta di allenamento può essere utilizzata per migliorare la precisione delle previsioni?
Ho dei dati di allenamento che sono etichettati con valori binari. Ho anche raccolto la fiducia di ciascuna di queste etichette, ovvero 0,8 di fiducia significherebbe che l'80% delle etichettatrici umane è d'accordo su tale etichetta. È possibile utilizzare questi dati di confidenza per migliorare l'accuratezza del mio classificatore? Il …


2
Perché la regressione di Gradient Boosting prevede valori negativi quando non ci sono valori y negativi nel mio set di allenamento?
Mentre aumenta il numero di alberi in scikit imparare s' GradientBoostingRegressor, ho previsioni più negative, anche se non ci sono valori negativi nella mia formazione e testing set. Ho circa 10 funzioni, la maggior parte delle quali binarie. Alcuni dei parametri che stavo sintonizzando erano: il numero di alberi / …

3
Convalida incrociata nidificata e selezione del miglior modello di regressione: è questo il processo SKLearn giusto?
Se ho capito bene, il CV nidificato può aiutarmi a valutare quale modello e processo di ottimizzazione dell'iperparametro sono i migliori. Il ciclo interno ( GridSearchCV) trova i migliori iperparametri e il ciclo esterno ( cross_val_score) valuta l'algoritmo di ottimizzazione dell'iperparametro. Scelgo quindi quale combinazione di tuning / modello dal …

1
sklearn - problema di overfitting
Sto cercando consigli sul modo migliore per affrontare il mio attuale problema di apprendimento automatico Lo schema del problema e quello che ho fatto è il seguente: Ho oltre 900 prove di dati EEG, in cui ogni prova dura 1 secondo. La verità fondamentale è nota per ciascuno e classifica …
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.