Esistono diversi post su come selezionare le funzionalità. Uno dei metodi descrive l'importanza delle funzionalità in base alle statistiche t. In R varImp(model)applicato su modello lineare con caratteristiche standardizzate viene utilizzato il valore assoluto della statistica t per ciascun parametro del modello. Quindi, fondamentalmente scegliamo una funzione in base alle …
Quindi capisco che la selezione delle variabili fa parte della selezione del modello. Ma in cosa consiste esattamente la selezione del modello? È più di quanto segue: 1) scegli una distribuzione per il tuo modello 2) scegliere variabili esplicative,? Lo chiedo perché sto leggendo un articolo Burnham & Anderson: AIC …
Ho un set di dati che rappresenta 1000 documenti e tutte le parole che appaiono in esso. Quindi le righe rappresentano i documenti e le colonne rappresentano le parole. Ad esempio, il valore nella cella sta per i tempi in cui la parola presenta nel documento . Ora, devo trovare …
Bloccato . Questa domanda e le sue risposte sono bloccate perché la domanda è fuori tema ma ha un significato storico. Al momento non accetta nuove risposte o interazioni. Sono molto nuovo di R. Sto imparando l'apprendimento automatico in questo momento. Molto dispiaciuto, se questa domanda sembra essere molto semplice. …
Sto cercando di ottenere un'intuizione sul perché aumentare il numero di funzionalità potrebbe ridurre le prestazioni. Attualmente sto usando un classificatore LDA che offre prestazioni migliori bivariatamente tra alcune funzionalità, ma peggio quando si guardano più funzionalità. La mia precisione di classificazione viene eseguita utilizzando un xval stratificato di 10 …
Ho dati con un numero minimo di funzionalità che non cambiano e alcune funzionalità aggiuntive che possono cambiare e avere un grande impatto sul risultato. Il mio set di dati è simile al seguente: Le caratteristiche sono A, B, C (sempre presente) e D, E, F, G, H (a volte …
Nota: questa domanda è una risposta, poiché la mia domanda precedente doveva essere cancellata per motivi legali. Confrontando PROC MIXED da SAS con la funzione lmedel nlmepacchetto in R, mi sono imbattuto in alcune differenze piuttosto confuse. Più specificamente, i gradi di libertà nei diversi test differiscono tra PROC MIXEDe …
L'approccio tradizionale alla selezione delle variabili è quello di trovare le variabili che contribuiscono maggiormente a prevedere una nuova risposta. Di recente ho scoperto un'alternativa a questo. Nel modellare le variabili che determinano l'effetto di un trattamento - come ad esempio in una sperimentazione clinica di un farmaco - si …
L'ingegnerizzazione delle funzionalità è spesso un componente importante dell'apprendimento automatico (è stato utilizzato pesantemente per vincere la Coppa KDD nel 2010 ). Tuttavia, trovo che anche la maggior parte delle tecniche di ingegneria delle caratteristiche distruggere qualsiasi significato intuitivo delle funzionalità sottostanti o sono molto specifici per un determinato dominio …
Devo ridurre il numero di variabili per condurre un'analisi del cluster. Le mie variabili sono fortemente correlate, quindi ho pensato di fare un PCA di analisi fattoriale (analisi dei componenti principali). Tuttavia, se uso i punteggi risultanti, i miei cluster non sono del tutto corretti (rispetto alle precedenti classificazioni in …
Ho programmato una regressione logistica usando l' algoritmo IRLS . Vorrei applicare una penalità LASSO per selezionare automaticamente le funzionalità giuste. Ad ogni iterazione, viene risolto quanto segue: (XTWX)δβ^=XT(y−p)(XTWX)δβ^=XT(y−p)\mathbf{\left(X^TWX\right) \delta\hat\beta=X^T\left(y-p\right)} Sia un numero reale non negativo. Non sto penalizzando l'intercettazione come suggerito in The Elements of. Apprendimento statistico . Idem …
Nel rilevamento compresso, c'è una garanzia teorema che ha una soluzione sparsa unica c (Vedi appendice per maggiori dettagli).argmin∥c∥1subject to y=Xcargmin‖c‖1subject to y=Xc\text{argmin} \Vert c \Vert_1\\ \text{subject to } y = Xc ccc Esiste un teorema simile per il lazo? Se esiste un tale teorema, non solo garantirà la stabilità …
Ho dati con alcune migliaia di funzionalità e voglio fare la selezione ricorsiva delle funzionalità (RFE) per rimuovere quelle non informative. Lo faccio con il cursore e RFE. Tuttavia, ho iniziato a pensare, se voglio ottenere la migliore misura di regressione (foresta casuale, ad esempio), quando devo eseguire la regolazione …
Nell'apprendimento per rinforzo, l'approssimazione di funzioni lineari viene spesso utilizzata quando sono presenti ampi spazi di stato. (Quando le tabelle di ricerca diventano impossibili.) La forma del valore con approssimazione della funzione lineare è data daQ -Q-Q- Q ( s , a ) = w1f1( s , a ) + …
Gli stimatori di Bayes sono immuni da errori di selezione? La maggior parte degli articoli che discutono la stima in alta dimensione, ad esempio i dati dell'intera sequenza del genoma, solleveranno spesso il problema della distorsione della selezione. La distorsione della selezione deriva dal fatto che, sebbene abbiamo migliaia di …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.