Nel contesto dell'apprendimento automatico, qual è la differenza tra
- apprendimento senza supervisione
- apprendimento supervisionato e
- apprendimento semi-supervisionato?
E quali sono alcuni dei principali approcci algoritmici da considerare?
Nel contesto dell'apprendimento automatico, qual è la differenza tra
E quali sono alcuni dei principali approcci algoritmici da considerare?
Risposte:
In generale, i problemi dell'apprendimento automatico possono essere considerati variazioni nella stima delle funzioni per classificazione, previsione o modellizzazione.
Nell'apprendimento supervisionato uno è dotato di input ( , , ...,) e output ( , , ...,) e sono sfidati a trovare una funzione che approssima questo comportamento in modo generalizzabile. L'output potrebbe essere un'etichetta di classe (in classificazione) o un numero reale (in regressione): si tratta della "supervisione" dell'apprendimento supervisionato.
Nel caso di apprendimento senza supervisione , nel caso di base, ricevi input , , ..., ma non vengono forniti output di destinazione, né ricompense dal suo ambiente. In base al problema (classificare o prevedere) e alla conoscenza di base dello spazio campionato, è possibile utilizzare vari metodi: stima della densità (stima di alcuni PDF sottostanti per la previsione), k-clustering di cluster (classificazione dei dati con valori reali senza etichetta), k- raggruppamento delle modalità (classificazione dei dati categorici senza etichetta), ecc.
L'apprendimento semi supervisionato comporta la stima delle funzioni su dati etichettati e non etichettati. Questo approccio è motivato dal fatto che i dati etichettati sono spesso costosi da generare, mentre i dati senza etichetta generalmente non lo sono. La sfida qui riguarda principalmente la questione tecnica di come trattare i dati mescolati in questo modo. Vedi questo sondaggio sulla letteratura di apprendimento semi-supervisionato per maggiori dettagli sui metodi di apprendimento semi-supervisionato.
Oltre a questo tipo di apprendimento, ce ne sono altri, come l' apprendimento per rinforzo in base al quale il metodo di apprendimento interagisce con il suo ambiente producendo azioni , ,. . .. che producono ricompense o punizioni , , ...
Apprendimento senza supervisione
L'apprendimento non supervisionato si verifica quando non sono disponibili dati etichettati per la formazione. Esempi di questo sono spesso metodi di clustering.
Apprendimento supervisionato
In questo caso i dati di allenamento esistono al di fuori dei dati etichettati. Il problema che risolvi qui è spesso la previsione delle etichette per i punti dati senza etichetta.
Apprendimento semi supervisionato
In questo caso vengono utilizzati sia i dati etichettati che quelli senza etichetta. Questo ad esempio può essere utilizzato nelle reti di credenze profonde, in cui alcuni livelli apprendono la struttura dei dati (senza supervisione) e un livello viene utilizzato per effettuare la classificazione (addestrato con dati supervisionati)
Non penso che supervisionato / non supervisionato sia il modo migliore per pensarci. Per il data mining di base, è meglio pensare a cosa stai cercando di fare. Esistono quattro attività principali:
predizione. se si prevede un numero reale, si chiama regressione. se si prevede un numero intero o una classe, si chiama classificazione.
modellazione. la modellazione è la stessa della previsione, ma il modello è comprensibile per l'uomo. Le reti neurali e le macchine vettoriali di supporto funzionano alla grande, ma non producono modelli comprensibili [1]. gli alberi decisionali e la regressione lineare classica sono esempi di modelli di facile comprensione.
somiglianza. se stai cercando di trovare gruppi naturali di attributi, si chiama analisi dei fattori. se stai cercando di trovare gruppi naturali di osservazioni, si chiama clustering.
associazione. è molto simile alla correlazione, ma per enormi set di dati binari.
[1] Apparentemente Goldman Sachs ha creato tonnellate di grandi reti neurali per la previsione, ma poi nessuno le ha comprese, quindi hanno dovuto scrivere altri programmi per cercare di spiegare le reti neurali.