Ho creato modelli con dati categorici per un po 'di tempo e quando in questa situazione fondamentalmente non utilizzo la funzione LabelEncoder di scikit-learn per trasformare questi dati prima di creare un modello. Capisco la differenza tra OHE, LabelEncodere DictVectorizorin termini di ciò che stanno facendo per i dati, ma …
È meglio codificare funzioni come il mese e l'ora come fattore o numerico in un modello di apprendimento automatico? Da un lato, ritengo che la codifica numerica potrebbe essere ragionevole, perché il tempo è un processo che avanza in avanti (il quinto mese è seguito dal sesto mese), ma dall'altro …
Sto cercando di capire come posso codificare le variabili categoriali usando la stima della probabilità, ma finora ho avuto scarso successo. Ogni suggerimento sarà molto apprezzato.
Nel caso di avere una combinazione di attributi categorici e numerici, di solito converto gli attributi categorici in vettori caldi. La mia domanda è: lascio i vettori così come sono e ridimensiono gli attributi numerici attraverso la standardizzazione / normalizzazione, o dovrei ridimensionare i vettori caldi insieme agli attributi numerici?
Sto partecipando a una competizione kaggle. Il set di dati ha circa 100 funzionalità e tutte sono sconosciute (in termini di ciò che effettivamente rappresentano). Fondamentalmente sono solo numeri. Le persone stanno eseguendo molta ingegneria di funzionalità su queste funzionalità. Mi chiedo come esattamente si è in grado di eseguire …
Chiuso . Questa domanda richiede dettagli o chiarezza . Al momento non accetta risposte. Vuoi migliorare questa domanda? Aggiungi dettagli e chiarisci il problema modificando questo post . Chiuso 3 anni fa . Sto lavorando a un set di dati di fantasia con 25 funzionalità. Due delle caratteristiche sono la …
Creo un corr()df da un df originale. Il corr()df è venuto fuori 70 X 70 ed è impossibile visualizzare il heatmap ... sns.heatmap(df). Se provo a visualizzare il corr = df.corr(), la tabella non si adatta allo schermo e posso vedere tutte le correlazioni. È un modo per stampare l'intero …
Stavo attraversando una soluzione della concorrenza sui prezzi delle case su Kaggle ( Human Analog's Kernel on House Prices: Advance Regression Techniques ) e mi sono imbattuto in questa parte: # Transform the skewed numeric features by taking log(feature + 1). # This will make the features more normal. from …
Sto leggendo una presentazione e mi consiglia di non utilizzare lasciare una codifica, ma va bene con una codifica a caldo. Pensavo fossero entrambi uguali. Qualcuno può descrivere quali sono le differenze tra loro?
Ho una domanda pratica sull'ingegneria delle caratteristiche ... diciamo che voglio prevedere i prezzi delle case usando la regressione logistica e ho usato un sacco di funzioni tra cui il codice postale. Quindi, controllando l'importanza della funzione, mi rendo conto che zip è una funzionalità piuttosto buona, quindi ho deciso …
Stavo leggendo il materiale relativo a XGBoost. Sembra che questo metodo non richieda alcun ridimensionamento variabile poiché si basa su alberi e questo può catturare interazioni complesse con schemi di non linearità. E può gestire variabili sia numeriche sia categoriche e sembra anche che le variabili ridondanti non influiscano troppo …
C'è qualche risorsa con un elenco di tecniche di ingegneria delle caratteristiche? Una mappatura di tipo di dati, modello e tecnica di ingegneria delle caratteristiche sarebbe una miniera d'oro
Ho i seguenti dati per un piccolo progetto laterale. Viene da un accelerometro seduto sopra una lavatrice / asciugatrice e vorrei che mi dicesse quando la macchina è finita. x è i dati di input (movimento x / y / z come un valore), y è l'etichetta on / off …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.