Individuazione di strutture nascoste (statistiche) in dati senza etichetta, incluso il clustering e l'estrazione delle funzionalità per la riduzione della dimensionalità.
Sto usando R per fare il clustering di K-significa. Sto usando 14 variabili per eseguire K-medie Qual è un modo carino per tracciare i risultati di K-mean? Ci sono implementazioni esistenti? Avere 14 variabili complica la rappresentazione dei risultati? Ho trovato qualcosa chiamato GGcluster che sembra bello ma è ancora …
Capisco come un artificial neural network (ANN), può essere addestrato in modo supervisionato usando backpropogation per migliorare l'adattamento diminuendo l'errore nelle previsioni. Ho sentito che un ANN può essere utilizzato per l'apprendimento senza supervisione, ma come può essere fatto senza una funzione di costo di qualche tipo per guidare le …
La codifica sparsa è definita come l'apprendimento di un insieme troppo completo di vettori di base per rappresentare i vettori di input (<- perché lo vogliamo). Quali sono le differenze tra codifica sparsa e autoencoder? Quando utilizzeremo la codifica sparsa e il codificatore automatico?
Carissimi, ho notato qualcosa di strano che non posso spiegare, vero? In sintesi: l'approccio manuale al calcolo di un intervallo di confidenza in un modello di regressione logistica e la funzione R confint()danno risultati diversi. Ho attraversato la regressione logistica applicata di Hosmer & Lemeshow (2a edizione). Nel terzo capitolo …
Sto eseguendo il clustering gerarchico sui dati raccolti ed elaborati dal dump dei dati reddit su Google BigQuery. Il mio processo è il seguente: Ricevi gli ultimi 1000 post in / r / politica Raccogli tutti i commenti Elaborare i dati e calcolare una n x mmatrice di dati (n: …
Apprendimento supervisionato 1) Un essere umano crea un classificatore basato su dati di input e output 2) Quel classificatore è addestrato con un set di dati di addestramento 3) Quel classificatore viene testato con un set di dati di test 4) Distribuzione se l' output è soddisfacente Da utilizzare quando, …
Supponiamo di avere due gruppi di dati, etichettati A e B (ciascuno contenente ad esempio 200 campioni e 1 funzione), e voglio sapere se sono diversi. Potrei: a) eseguire un test statistico (ad es. t-test) per vedere se sono statisticamente diversi. b) utilizzare l'apprendimento automatico supervisionato (ad es. classificatore vettoriale …
Nel contesto dell'apprendimento automatico, qual è la differenza tra apprendimento senza supervisione apprendimento supervisionato e apprendimento semi-supervisionato? E quali sono alcuni dei principali approcci algoritmici da considerare?
Sto cercando di fare analisi delle serie storiche e sono nuovo in questo campo. Ho un conteggio giornaliero di un evento dal 2006 al 2009 e voglio adattarlo ad un modello di serie storica. Ecco i progressi che ho fatto: timeSeriesObj = ts(x,start=c(2006,1,1),frequency=365.25) plot.ts(timeSeriesObj) La trama risultante che ottengo è: …
Ho alcuni punti in R p , e voglio raggruppare i punti in modo che:X={x1,...,xn}X={x1,...,xn}X=\{x_1,...,x_n\}RpRpR^p Ciascun cluster contiene un numero uguale di elementi di . (Supponiamo che il numero di cluster divida .)XXXnnn Ogni cluster è "spazialmente coeso" in un certo senso, come i cluster di medie.kkk È facile pensare …
La seconda domanda è che ho trovato in una discussione da qualche parte sul web parlare di "clustering supervisionato", per quanto ne so, il clustering non è supervisionato, quindi qual è esattamente il significato dietro "clustering supervisionato"? Qual è la differenza rispetto alla "classificazione"? Ci sono molti link che ne …
Quali sono le differenze tra modelli generativi e discriminatori (discriminanti) (nel contesto dell'apprendimento e dell'inferenza bayesiani)? e cosa riguarda la predizione, la teoria delle decisioni o l'apprendimento senza supervisione?
Per semplicità, supponiamo di lavorare sul classico esempio di e-mail spam / non spam. Ho un set di 20000 e-mail. Di questi, so che 2000 sono spam ma non ho alcun esempio di e-mail non spam. Vorrei prevedere se i restanti 18000 sono spam o meno. Idealmente, il risultato che …
Sto cercando di capire cosa significhi l'assunzione multiforme nell'apprendimento semi-supervisionato. Qualcuno può spiegare in modo semplice? Non riesco a capire l'intuizione. Dice che i tuoi dati si trovano su una varietà a bassa dimensione incorporata in uno spazio di dimensione superiore. Non ho capito cosa significhi.
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.