Domande taggate «scikit-learn»

Scikit-learn è un modulo Python composto da uno strumento semplice ed efficiente per l'apprendimento automatico, il data mining e l'analisi dei dati. È basato su NumPy, SciPy e matplotlib. È distribuito sotto la licenza BSD a 3 clausole.

2
Puoi spiegare la differenza tra SVC e LinearSVC in scikit-learn?
Di recente ho iniziato a imparare a lavorare con sklearne ho appena riscontrato questo risultato peculiare. Ho usato il digitsset di dati disponibile sklearnper provare diversi modelli e metodi di stima. Quando ho testato un modello di Support Vector Machine sui dati, ho scoperto che ci sono due diverse classi …
19 svm  scikit-learn 

1
Come gestire le etichette di stringa nella classificazione multi-classe con keras?
Sono alle prime armi con l'apprendimento automatico e le macchine fotografiche e ora sto lavorando a un problema di classificazione delle immagini multi-classe usando le macchine fotografiche. L'input è immagine taggata. Dopo alcune preelaborazioni, i dati di allenamento sono rappresentati nell'elenco Python come: [["dog", "path/to/dog/imageX.jpg"],["cat", "path/to/cat/imageX.jpg"], ["bird", "path/to/cat/imageX.jpg"]] "cane", "gatto" …


1
Algoritmi per il clustering di testo
Ho un problema nel raggruppare una grande quantità di frasi in gruppi in base al loro significato. Questo è simile a un problema quando hai molte frasi e vuoi raggrupparle in base al loro significato. Quali algoritmi sono suggeriti per fare questo? Non conosco il numero di cluster in anticipo …

5
Unione di dati sparsi e densi nell'apprendimento automatico per migliorare le prestazioni
Ho caratteristiche sparse che sono predittive, inoltre ho alcune caratteristiche dense che sono anche predittive. Devo combinare queste funzionalità insieme per migliorare le prestazioni complessive del classificatore. Ora, il problema è che quando provo a combinarli insieme, le funzioni dense tendono a dominare di più rispetto alle funzioni sparse, offrendo …



5
ingrandisci la mappa di calore dei nati marini
Creo un corr()df da un df originale. Il corr()df è venuto fuori 70 X 70 ed è impossibile visualizzare il heatmap ... sns.heatmap(df). Se provo a visualizzare il corr = df.corr(), la tabella non si adatta allo schermo e posso vedere tutte le correlazioni. È un modo per stampare l'intero …
16 visualization  pandas  plotting  machine-learning  neural-network  svm  decision-trees  svm  efficiency  python  linear-regression  machine-learning  nlp  topic-model  lda  named-entity-recognition  naive-bayes-classifier  association-rules  fuzzy-logic  kaggle  deep-learning  tensorflow  inception  classification  feature-selection  feature-engineering  machine-learning  scikit-learn  tensorflow  keras  encoding  nlp  text-mining  nlp  rnn  python  neural-network  feature-extraction  machine-learning  predictive-modeling  python  r  linear-regression  clustering  r  ggplot2  neural-network  neural-network  training  python  neural-network  deep-learning  rnn  predictive-modeling  databases  sql  programming  distribution  dataset  cross-validation  neural-network  deep-learning  rnn  machine-learning  machine-learning  python  deep-learning  data-mining  tensorflow  visualization  tools  sql  embeddings  orange  feature-extraction  unsupervised-learning  gan  machine-learning  python  data-mining  pandas  machine-learning  data-mining  bigdata  apache-spark  apache-hadoop  deep-learning  python  convnet  keras  aggregation  clustering  k-means  r  random-forest  decision-trees  reference-request  visualization  data  pandas  plotting  neural-network  keras  rnn  theano  deep-learning  tensorflow  inception  predictive-modeling  deep-learning  regression  sentiment-analysis  nlp  encoding  deep-learning  python  scikit-learn  lda  convnet  keras  predictive-modeling  regression  overfitting  regression  svm  prediction  machine-learning  similarity  word2vec  information-retrieval  word-embeddings  neural-network  deep-learning  rnn 

1
Metodo di punteggio OOB RandomForestClassifier
L'implementazione casuale della foresta in scikit-learn utilizza l'accuratezza media come metodo di calcolo del punteggio per stimare l'errore di generalizzazione con campioni out-of-bag? Questo non è menzionato nella documentazione, ma il metodo score () riporta l'accuratezza media. Ho un set di dati altamente sbilanciato e sto usando AUC di ROC …


2
Come funziona SelectKBest?
Sto guardando questo tutorial: https://www.dataquest.io/mission/75/improving-your-submission Alla sezione 8, trovando le migliori caratteristiche, mostra il seguente codice. import numpy as np from sklearn.feature_selection import SelectKBest, f_classif predictors = ["Pclass", "Sex", "Age", "SibSp", "Parch", "Fare", "Embarked", "FamilySize", "Title", "FamilyId"] # Perform feature selection selector = SelectKBest(f_classif, k=5) selector.fit(titanic[predictors], titanic["Survived"]) # Get the …

3
Panda Dataframe su DMatrix
Sto cercando di eseguire xgboost in scikit learn. E io uso solo Panda per caricare i dati in dataframe. Come dovrei usare Panda Panda con xgboost. Sono confuso dalla routine DMatrix richiesta per eseguire xgboost algo.

1
Importanza delle caratteristiche con caratteristiche categoriche ad alta cardinalità per la regressione (variabile numerica dipendente)
Stavo cercando di usare le importazioni delle funzionalità dalle foreste casuali per eseguire alcune selezioni empiriche di funzionalità per un problema di regressione in cui tutte le funzionalità sono categoriche e molte hanno molti livelli (dell'ordine di 100-1000). Dato che la codifica one-hot crea una variabile fittizia per ogni livello, …


1
Selezione delle funzionalità utilizzando le importazioni delle funzionalità in foreste casuali con scikit-learn
Ho tracciato l'importanza delle funzionalità in foreste casuali con scikit-learn . Al fine di migliorare la previsione utilizzando foreste casuali, come posso utilizzare le informazioni sulla trama per rimuovere le funzionalità? Vale a dire come individuare se una funzione è inutile o, se non peggio, diminuisce le prestazioni delle foreste …

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.