Ho letto da qualche parte che se abbiamo funzionalità troppo correlate, dobbiamo rimuoverne una, poiché ciò potrebbe peggiorare il modello. È chiaro che funzionalità correlate significano che portano le stesse informazioni, quindi è logico rimuoverne una. Ma non riesco a capire perché questo possa peggiorare il modello.
Supponiamo che io costruisca un NN per la classificazione. L'ultimo livello è un livello denso con attivazione softmax. Ho cinque diverse classi da classificare. Supponiamo per un singolo esempio di allenamento, true labelè [1 0 0 0 0]mentre le previsioni sono [0.1 0.5 0.1 0.1 0.2]. Come calcolare la perdita …
Sono ancora confuso sulla differenza tra Densee TimeDistributedDensedi Kerasanche se ci sono già alcune domande simili poste qui e qui . Le persone discutono molto, ma nessuna conclusione condivisa. E anche se, qui , @fchollet ha dichiarato che: TimeDistributedDenseapplica una stessa operazione Dense(completamente connessa) a ogni timestep di un tensore …
Quando dico "documento", ho in mente pagine web come articoli di Wikipedia e notizie. Preferisco le risposte fornendo metriche della distanza lessicale vaniglia o metriche della distanza semantica all'avanguardia, con una preferenza più forte per quest'ultima.
Ho un grosso problema con un grande set di dati (ad esempio 50 milioni di righe e 200 colonne). Il set di dati è costituito da circa 100 colonne numeriche e 100 colonne categoriche e una colonna di risposta che rappresenta un problema di classe binaria. La cardinalità di ciascuna …
Perché usare softmax in contrapposizione alla normalizzazione standard? Nell'area dei commenti della risposta principale a questa domanda, @Kilian Batzner ha sollevato 2 domande che mi confondono molto. Sembra che nessuno dia una spiegazione tranne i vantaggi numerici. Ottengo i motivi per usare la perdita di entropia incrociata, ma come si …
Mi sembra che la funzione VVV possa essere facilmente espressa dalla funzione QQQ e quindi la funzione VVV sembra superflua. Tuttavia, sono nuovo nell'apprendimento del rinforzo, quindi credo di aver sbagliato qualcosa. definizioni L'apprendimento Q e V sono nel contesto dei processi decisionali di Markov . Un MDP è una …
Nelle attività di apprendimento automatico è comune mescolare i dati e normalizzarli. Lo scopo della normalizzazione è chiaro (per avere lo stesso intervallo di valori di funzionalità). Ma, dopo aver lottato molto, non ho trovato alcun motivo valido per mescolare i dati. Ho letto questo post qui discutendo quando dobbiamo …
Nel contesto di Machine Learning , ho visto molto spesso il termine Ground Truth . Ho cercato molto e ho trovato la seguente definizione in Wikipedia : Nell'apprendimento automatico, il termine "verità di base" si riferisce all'accuratezza della classificazione del set di addestramento per le tecniche di apprendimento supervisionato. Questo …
Sto cercando di formare un modello di aumento gradiente su 50.000 esempi con 100 funzioni numeriche. XGBClassifiergestisce 500 alberi entro 43 secondi sulla mia macchina, mentre GradientBoostingClassifiergestisce solo 10 alberi (!) in 1 minuto e 2 secondi :( Non mi sono preoccupato di provare a far crescere 500 alberi perché …
Ho un problema di classificazione con circa 1000 campioni positivi e 10000 negativi nel set di allenamento. Quindi questo set di dati è abbastanza sbilanciato. La semplice foresta casuale sta solo cercando di contrassegnare tutti i campioni di test come una classe di maggioranza. Ecco alcune buone risposte sul sottocampionamento …
Quando si dovrebbe usare Random Forestoltre SVMe viceversa? Lo capisco cross-validatione il confronto tra modelli è un aspetto importante nella scelta di un modello, ma qui vorrei saperne di più sulle regole empiriche e sull'euristica dei due metodi. Qualcuno può spiegare le sottigliezze, i punti di forza e di debolezza …
Nota che sto facendo tutto in R. Il problema si presenta come segue: Fondamentalmente, ho un elenco di curriculum (CV). Alcuni candidati avranno prima esperienza lavorativa e altri no. L'obiettivo qui è: sulla base del testo dei loro CV, voglio classificarli in diversi settori lavorativi. Sono particolare in quei casi, …
Quindi, non sono stato in grado di trovare alcuna letteratura su questo argomento, ma sembra qualcosa che valga la pena di pensare: Quali sono le migliori pratiche nella formazione e ottimizzazione dei modelli se sono disponibili nuove osservazioni? Esiste un modo per determinare il periodo / la frequenza della riqualificazione …
Ho notato che termini come iperparametro del modello e parametro del modello sono stati usati in modo intercambiabile sul web senza un chiarimento preventivo. Penso che questo sia errato e necessita di spiegazioni. Prendi in considerazione un modello di apprendimento automatico, un classificatore o riconoscitore di immagini basato su SVM …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.