Nel documento Faster RCNN quando si parla di ancoraggio, cosa significano usando "piramidi di caselle di riferimento" e come si fa? Questo significa semplicemente che in ciascuno dei punti di ancoraggio W * H * k viene generato un rettangolo di selezione? Dove W = larghezza, H = altezza e …
Ho letto di SVM e ho appreso che stanno risolvendo un problema di ottimizzazione e l'idea del margine massimo era molto ragionevole. Ora, usando i kernel, riescono a trovare anche i confini di separazione non lineari, il che era grandioso. Finora, non ho davvero idea di come SVM (una macchina …
Uso RNN bidirezionale per rilevare un evento di evento sbilanciato. La classe positiva è 100 volte meno spesso della classe negativa. Sebbene non sia possibile utilizzare la regolarizzazione, posso ottenere una precisione del 100% sul set di treni e del 30% sul set di convalida. Attivo la regolarizzazione l2 e …
Supponiamo che io abbia un'architettura di modello di deep learning, nonché una dimensione mini-batch scelta. Come posso derivare da questi i requisiti di memoria previsti per l'addestramento di quel modello? Ad esempio, si consideri un modello (non ricorrente) con input di dimensione 1000, 4 layer nascosti completamente connessi di dimensione …
Ho un set di dati sbilanciato in un'attività di classificazione binaria, in cui l'importo positivo e negativo è dello 0,3% vs 99,7%. Il divario tra positivi e negativi è enorme. Quando alleno una CNN con la struttura utilizzata nel problema MNIST, il risultato del test mostra un alto tasso di …
Di recente ho visto questo discorso di Eric J. Ma e ho controllato il suo blog , in cui cita Radford Neal, che i modelli bayesiani non si adattano troppo (ma possono adattarsi troppo ) e quando li usano, non abbiamo bisogno di set di test per convalidarli (per me …
Esempi: ho una frase nella descrizione del lavoro: "Ingegnere senior Java nel Regno Unito". Voglio usare un modello di apprendimento profondo per prevederlo in 2 categorie: English e IT jobs. Se uso il modello di classificazione tradizionale, posso solo prevedere 1 etichetta con la softmaxfunzione all'ultimo livello. Quindi, posso usare …
Come si interpreta una curva di sopravvivenza dal modello di rischio proporzionale cox? In questo esempio di giocattolo, supponiamo di avere un modello di rischio proporzionale cox su agevariabile nei kidneydati e generare la curva di sopravvivenza. library(survival) fit <- coxph(Surv(time, status)~age, data=kidney) plot(conf.int="none", survfit(fit)) grid() Ad esempio, al momento …
Sto addestrando una semplice rete neurale convoluzionale per la regressione, in cui il compito è prevedere la posizione (x, y) di una scatola in un'immagine, ad esempio: L'output della rete ha due nodi, uno per x e uno per y. Il resto della rete è una rete neurale convoluzionale standard. …
Voglio calcolare l'importanza di ogni funzione di input usando il modello profondo. Ma ho trovato solo un articolo sulla selezione delle funzionalità utilizzando l'apprendimento approfondito: selezione approfondita delle funzionalità . Inseriscono uno strato di nodi collegati direttamente a ciascuna funzione, prima del primo livello nascosto. Ho sentito che Deep Network …
Sto imparando il deep learning (in particolare le CNN) e come in genere richiede moltissimi dati per prevenire un eccesso di adattamento. Tuttavia, mi è stato anche detto che maggiore è la capacità / più parametri ha un modello, più dati sono necessari per evitare un eccesso di adattamento. Pertanto, …
Secondo "Efficient Backprop" di LeCun et al (1998) è buona norma normalizzare tutti gli input in modo che siano centrati attorno a 0 e rientrino nell'intervallo della seconda derivata massima. Quindi, per esempio, useremmo [-0.5,0.5] per la funzione "Tanh". Questo per aiutare il progresso della retro-propagazione man mano che l'Assia …
Assumi la seguente sequenza 1 dimensionale: A, B, C, Z, B, B, #, C, C, C, V, $, W, A, % ... Le lettere A, B, C, ..qui rappresentano eventi "ordinari". I simboli #, $, %, ...qui rappresentano eventi "speciali" La spaziatura temporale tra tutti gli eventi è non uniforme …
Dopo aver letto molti articoli di deep learning, una sorta di sensazione approssimativa è che ci sono molti trucchi nell'allenamento della rete per ottenere prestazioni migliori del normale. Dal punto di vista delle applicazioni del settore, è molto difficile sviluppare questo tipo di trucchi, tranne quei gruppi di ricerca d'élite …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.