Individuazione di strutture nascoste (statistiche) in dati senza etichetta, incluso il clustering e l'estrazione delle funzionalità per la riduzione della dimensionalità.
In " Reti convoluzionali di convinzione profonda per l'apprendimento senza supervisione scalabile di rappresentazioni gerarchiche " di Lee et. al. ( PDF ) Vengono proposti DBN convoluzionali. Inoltre, il metodo viene valutato per la classificazione delle immagini. Sembra logico, in quanto ci sono caratteristiche naturali dell'immagine locale, come piccoli angoli …
Ho un GLMM del modulo: lmer(present? ~ factor1 + factor2 + continuous + factor1*continuous + (1 | factor3), family=binomial) Quando uso drop1(model, test="Chi"), ottengo risultati diversi rispetto a quelli che utilizzo Anova(model, type="III")dal pacchetto auto o summary(model). Questi ultimi due danno le stesse risposte. Usando un mucchio di dati fabbricati, …
Attualmente sto studiando la visualizzazione di dati ad alta dimensione usando t-SNE. Ho alcuni dati con variabili binarie e continue miste e i dati sembrano raggruppare i dati binari troppo prontamente. Naturalmente questo è previsto per i dati in scala (tra 0 e 1): la distanza euclidea sarà sempre massima …
Quindi, ottenere "un'idea" del numero ottimale di cluster in k-mean è ben documentato. Ho trovato un articolo su come farlo in miscele gaussiane, ma non sono sicuro di esserne convinto, non lo capisco molto bene. C'è un modo ... più delicato di farlo?
Esempi: ho una frase nella descrizione del lavoro: "Ingegnere senior Java nel Regno Unito". Voglio usare un modello di apprendimento profondo per prevederlo in 2 categorie: English e IT jobs. Se uso il modello di classificazione tradizionale, posso solo prevedere 1 etichetta con la softmaxfunzione all'ultimo livello. Quindi, posso usare …
Sto cercando di raggruppare insieme diversi set di dati utilizzando algoritmi non supervisionati (clustering). Il problema è che ho molte funzionalità (~ 500) e una piccola quantità di casi (200-300). Finora ero solito fare solo problemi di classificazione per i quali avevo sempre etichettato i dati come set di addestramento. …
Le reti di autoencoder sembrano essere molto più complicate delle normali reti MLP classificatore. Dopo diversi tentativi di utilizzo di Lasagne, tutto ciò che ottengo nell'output ricostruito è qualcosa che assomiglia al meglio a una media sfocata di tutte le immagini del database MNIST senza distinzioni su cosa sia effettivamente …
Il mio obiettivo è analizzare i log di rete (ad es. Apache, syslog, audit di sicurezza di Active Directory e così via) utilizzando il rilevamento di clustering / anomalie ai fini del rilevamento delle intrusioni. Dai registri ho molti campi di testo come indirizzo IP, nome utente, nome host, porta …
Il mio set di dati comprende la mortalità totale o la sopravvivenza di un organismo in tre tipi di siti: costiera, midchannel e offshore. I numeri nella tabella seguente rappresentano il numero di siti. 100% Mortality 100% Survival Inshore 30 31 Midchannel 10 20 Offshore 1 10 Vorrei sapere se …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.