In molti algoritmi di machine learning, il ridimensionamento delle funzioni (noto anche come ridimensionamento variabile, normalizzazione) è un passaggio di preprocessamento comune Wikipedia - Ridimensionamento delle funzionalità - questa domanda era vicina Domanda n. 41704 - Come e perché funzionano la normalizzazione e il ridimensionamento delle funzioni? Ho due domande …
La selezione delle funzioni deve essere eseguita solo sui dati di allenamento (o su tutti i dati)? Ho esaminato alcune discussioni e articoli come Guyon (2003) e Singhi e Liu (2006) , ma non sono ancora sicuro della risposta giusta. La configurazione del mio esperimento è la seguente: Set di …
Sto cercando una risposta intuitiva al perché un modello GLM LASSO seleziona un predittore specifico da un gruppo di quelli altamente correlati e perché lo fa in modo diverso dalla migliore selezione delle funzioni del sottoinsieme. Dalla geometria di LASSO mostrata in Fig. 2 in Tibshirani 1996 sono portato a …
Sto cercando di applicare l'idea di informazioni reciproche per la selezione delle funzioni, come descritto in queste note di lezione (a pagina 5). La mia piattaforma è Matlab. Un problema che riscontro nel calcolo delle informazioni reciproche da dati empirici è che il numero è sempre distorto verso l'alto. Ho …
Ho accesso a un set di dati molto grande. I dati provengono da registrazioni MEG di persone che ascoltano brani musicali, di uno dei quattro generi. I dati sono i seguenti: 6 soggetti 3 ripetizioni sperimentali (epoche) 120 prove per epoca 8 secondi di dati per prova a 500Hz (= …
Ho un set di dati con circa 70 variabili che vorrei ridurre. Quello che sto cercando di fare è usare CV per trovare le variabili più utili nel modo seguente. 1) Seleziona in modo casuale diciamo 20 variabili. 2) Utilizzare stepwise/ LASSO/ lars/ etc per scegliere le variabili più importanti. …
Sto usando SVM per prevedere il diabete. Sto usando il set di dati BRFSS per questo scopo. Il set di dati ha le dimensioni di ed è inclinato. La percentuale di s nella variabile target è mentre s costituisce il restante .11 % 89 %432607×136432607×136432607 \times 136Y11%11%11\%N89%89%89\% Sto usando solo …
Una domanda per principianti qui. Attualmente sto eseguendo una regressione non parametrica usando il pacchetto np in R. Ho 7 caratteristiche e usando un approccio di forza bruta ho identificato i migliori 3. Ma presto avrò molte più di 7 caratteristiche! La mia domanda è quali sono i migliori metodi …
Ho tre funzionalità che utilizzo per risolvere un problema di classificazione. Inizialmente, queste caratteristiche producevano valori booleani, quindi ho potuto valutare la loro ridondanza osservando quanto si sovrappongono gli insiemi di classificazioni positive e negative. Ora ho invece esteso le funzionalità per produrre valori reali (punteggi), e vorrei analizzarne nuovamente …
Ecco il mio codice per il metodo di selezione delle funzionalità in Python: from sklearn.svm import LinearSVC from sklearn.datasets import load_iris iris = load_iris() X, y = iris.data, iris.target X.shape (150, 4) X_new = LinearSVC(C=0.01, penalty="l1", dual=False).fit_transform(X, y) X_new.shape (150, 3) Ma dopo aver ottenuto la nuova X (variabile dipendente …
Mi chiedo se è una buona idea rimuovere quelle variabili con un valore di importanza variabile negativa ("% IncMSE") in un contesto di regressione. E se mi dà una previsione migliore? Cosa ne pensi?
Quindi ho letto alcuni libri (o parti di essi) sulla modellazione (tra le altre "Strategie di modellizzazione della regressione" di F. Harrell), dato che la mia situazione attuale in questo momento è che devo fare un modello logistico basato su dati binari di risposta. Ho entrambi i dati continui, categorici …
Ho un set di dati con tre variabili, in cui tutte le variabili sono quantitative. Lascialo chiamare , e . Sto adattando un modello di regressione in una prospettiva bayesiana tramite MCMC conyyyx1x1x_1x2x2x_2rjags Ho fatto un'analisi esplorativa e il grafico a dispersione di suggerisce che dovrebbe essere usato un termine …
Voglio calcolare l'importanza di ogni funzione di input usando il modello profondo. Ma ho trovato solo un articolo sulla selezione delle funzionalità utilizzando l'apprendimento approfondito: selezione approfondita delle funzionalità . Inseriscono uno strato di nodi collegati direttamente a ciascuna funzione, prima del primo livello nascosto. Ho sentito che Deep Network …
In The Elements of Statistical Learning , ho trovato la seguente dichiarazione: Esiste una qualifica: le fasi iniziali di screening senza supervisione possono essere eseguite prima che i campioni vengano esclusi. Ad esempio, potremmo selezionare i 1000 predittori con la varianza più elevata tra tutti i 50 campioni, prima di …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.