Sto usando l'esempio di OpenCV letter_recog.cpp per sperimentare su alberi casuali e altri classificatori. Questo esempio ha implementazioni di sei classificatori: alberi casuali, boosting, MLP, kNN, ingenui Bayes e SVM. Viene utilizzato il set di dati di riconoscimento lettere UCI con 20000 istanze e 16 funzionalità, che ho diviso a …
Ho un problema di classificazione binaria: Circa 1000 campioni in set di allenamento 10 attributi, inclusi binari, numerici e categorici Quale algoritmo è la scelta migliore per questo tipo di problema? Per impostazione predefinita, inizierò con SVM (preliminare con valori di attributi nominali convertiti in funzioni binarie), poiché è considerato …
Sto lavorando per migliorare un classificatore supervisionato esistente, per classificare le sequenze di {proteine} come appartenenti a una classe specifica (precursori dell'ormone neuropeptide) o no. Esistono circa 1.150 "positivi" noti, su uno sfondo di circa 13 milioni di sequenze di proteine ("Sfondo sconosciuto / scarsamente annotato"), o circa 100.000 proteine …
Ho riscontrato un problema di classificazione e ho letto il codice e le esercitazioni di molte persone. Una cosa che ho notato è che molte persone prendono np.logo logdi variabili continue come loan_amounto applicant_incomeecc. Voglio solo capire il motivo dietro. Aiuta a migliorare la precisione della previsione del nostro modello. …
Creo un corr()df da un df originale. Il corr()df è venuto fuori 70 X 70 ed è impossibile visualizzare il heatmap ... sns.heatmap(df). Se provo a visualizzare il corr = df.corr(), la tabella non si adatta allo schermo e posso vedere tutte le correlazioni. È un modo per stampare l'intero …
Attualmente sto usando XGBoost per la previsione del rischio, sembra che stia facendo un buon lavoro nel dipartimento di classificazione binaria, ma le uscite di probabilità sono molto lontane, cioè cambiare il valore di una caratteristica in un'osservazione di una quantità molto piccola può fare la probabilità salto in uscita …
Sto lavorando a un problema di classificazione. Ho un set di dati contenente lo stesso numero di variabili categoriche e variabili continue. Come faccio a sapere quale tecnica utilizzare? tra un albero decisionale e una regressione logistica? È giusto supporre che la regressione logistica sarà più adatta per la variabile …
Ho un set di dati di utenti che acquistano prodotti da un sito Web. Gli attributi che ho sono ID utente, regione (stato) dell'utente, ID categorie di prodotto, ID parole chiave del prodotto, ID parole chiave del sito Web e importo delle vendite speso del prodotto. L'obiettivo è quello di …
Ho un set di dati con le seguenti specifiche: Set di dati di addestramento con 193.176 campioni con 2.821 positivi Set di dati di prova con 82.887 campioni con 673 positivi Ci sono 10 funzioni. Voglio eseguire una classificazione binaria (0 o 1). Il problema che sto affrontando è che …
Ho due domande relative agli alberi decisionali: Se abbiamo un attributo continuo, come possiamo scegliere il valore di divisione? Esempio: Età = (20,29,50,40 ....) Immaginiamo di avere un attributo continuo che hanno valori in R . Come posso scrivere un algoritmo che trova il punto di divisione v , in …
Se ho un set di dati di allenamento e mi alleno un classificatore Naes Bayes su di esso e ho un valore di attributo che ha probabilità zero. Come posso gestirlo se in seguito voglio prevedere la classificazione su nuovi dati? Il problema è che se nel calcolo c'è uno …
Qualcuno può dirmi qual è lo scopo della generazione di funzionalità? e perché è necessario l'arricchimento dello spazio delle caratteristiche prima di classificare un'immagine? È un passo necessario? Esiste un metodo per arricchire lo spazio delle funzionalità?
Vorrei sapere qual è il modo migliore per classificare un set di dati composto da tipi misti di attributi, ad esempio testuale e numerico. So di poter convertire testuale in booleano, ma il vocabolario è vario e i dati diventano troppo scarsi. Ho anche cercato di classificare i tipi di …
Devo sapere perché dobbiamo affrontare lo squilibrio dei dati. So come affrontarlo e diversi metodi per risolvere il problema che consiste nel campionare in alto o in basso o usando Smote. Ad esempio, se ho una malattia rara dell'1 percento su 100, e diciamo che ho deciso di avere un …
Al momento sto giocando con Restricted Boltzmann Machines e dato che ci sono, vorrei provare a classificare le cifre scritte a mano con esso. Il modello che ho creato ora è un modello generativo piuttosto elaborato ma non so come andare oltre. In questo articolo l'autore afferma che, dopo aver …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.