Esiste una "regressione senza supervisione"?


15

Se ho ragione, la "classificazione senza supervisione" è la stessa del clustering. Quindi c'è "regressione senza supervisione"? Grazie!

Risposte:


20

Non ho mai incontrato questo termine prima. Non sono sicuro se diffonderebbe luce o oscurità all'interno di entrambi i regni della statistica: quelli che sono apprendimento automatico (dove le distinzioni supervisionate e non supervisionate sono fondamentali per la risoluzione dei problemi) e le statistiche inferenziali (dove la regressione, l'analisi di conferma e gli NHST sono spesso impiegati).

Laddove queste due filosofie si sovrappongono, la maggior parte della regressione e la terminologia associata vengono gettate in un ambiente strettamente controllato. Tuttavia, penso che molti concetti esistenti nell'apprendimento non supervisionato siano strettamente correlati agli approcci basati sulla regressione, specialmente quando si itera ingenuamente su ogni classe o caratteristica come risultato e si uniscono i risultati. Un esempio di questo è l'analisi della correlazione PCA e bivariata. Applicando la migliore regressione del sottoinsieme in modo iterativo su un numero di variabili, è possibile eseguire una sorta di stima di rete molto complessa, come si ipotizza nella modellazione di equazioni strutturali (rigorosamente in senso EFA). Questo, per me, sembra un problema di apprendimento incustodito con regressione.

Tuttavia, le stime dei parametri di regressione non sono riflessive. Per la semplice regressione lineare, regressione su vi darà risultati diversi, inferenza diverse, e diverse stime (nemmeno inversa necessariamente), di su . Nella mia mente, questa mancanza di commutatività rende la maggior parte delle applicazioni di regressione ingenue non ammissibili per problemi di apprendimento senza supervisione.YXXY


4
+1 e voto oscurità. Una ricerca su Google fornisce una serie di riferimenti a "regressione senza supervisione", molti dei quali sono caratterizzati da modelli di equazioni strutturali / sapore di classi latenti. Da una breve rassegna di questi documenti, tenderei personalmente a descriverli come applicare i metodi dei minimi quadrati (LS) e della massimizzazione delle aspettative (EM) a problemi senza supervisione, piuttosto che "regressione senza supervisione"
JBK

Grazie! Mi chiedo se i problemi di apprendimento senza supervisione abbiano commutatività?
Tim

La maggior parte delle applicazioni di apprendimento senza supervisione che ho riscontrato riguardano la stima della covarianza e il clustering (altamente correlato). Poiché in queste applicazioni è possibile permutare arbitrariamente colonne di dati senza causare alcun disagio e non è necessario designare variabili come caratteristiche o risposte, direi che queste applicazioni sono commutative.
AdamO,

4

La cosa più vicina a cui riesco a pensare è una piccola magia nera che ha suscitato la gente quando è stata annunciata alcuni anni fa, ma non credo che abbia guadagnato una vera trazione nella comunità. Gli autori hanno sviluppato una statistica che hanno chiamato "Maximal Information Coefficient (MIC)". L'idea generale alla base del loro metodo è quella di prendere dati altamente dimensionali, tracciare ogni variabile rispetto a ogni altra variabile in coppie e quindi applicare un interessante algoritmo di window-binning a ciascun grafico (che calcola il MIC per quelle due variabili) per determinare se ci sia potenzialmente una relazione tra le due variabili. La tecnica dovrebbe essere robusta per identificare relazioni strutturate in modo arbitrario , non solo lineari.

La tecnica prende di mira coppie di variabili, ma sono sicuro che potrebbe essere estesa per indagare le relazioni multivariate. Il problema principale sarebbe che dovresti eseguire la tecnica su un numero significativamente maggiore di combinazioni di variabili mentre permetti permutazioni di sempre più variabili. Immagino che probabilmente ci vorrà del tempo solo con le coppie: tentare di usarlo anche su dati di dimensioni anche lontanamente remote e considerare relazioni più complesse rispetto alle coppie di variabili diventerebbe rapidamente intrattabile.

Fai riferimento al documento Rilevamento di nuove associazioni in set di dati di grandi dimensioni (2011)


0

La regressione automatica è un modo per calcolare i pesi di una matrice minimizzando l'errore su input ricostruito da input dato.


0

Questa domanda mi è venuta in mente mentre cercavo la differenza tra metodi supervisionati e non supervisionati. Provenendo da un background econometrico, preferisco pensare ai modelli, il che ha rallentato la mia comprensione poiché la maggior parte della letteratura di apprendimento automatico che ho incontrato si concentra sui metodi.

Ciò che ho scoperto finora è che dovrebbe essere fatta una distinzione rigorosa tra clustering(senza supervisione) e classification(supervisionata). L'analogia continua della relazione tra questi design dei modelli sarebbe principal component analysis(senza supervisione) rispetto a linear regression(supervisionata).

Tuttavia, direi che la relazione tra clustering e classificazione è puramente casuale; esiste solo quando interpretiamo entrambi i modelli come descrivendo una relazione geometrica, che trovo inutilmente restrittiva. Tutti i metodi non controllati che conosco (k-medie, algoritmi di mappe elastiche come kohonen / gas neurale, DBSCAN, PCA) possono anche essere interpretati come modelli variabili latenti. Nel caso dei metodi di clustering, ciò equivarrebbe a visualizzare l'appartenenza a un cluster come in uno stato, che può essere codificato come un modello di variabile latente introducendo i manichini di stato.

Data l'interpretazione come modelli variabili latenti, sei libero di specificare qualsiasi modello, possibilmente non lineare, che descriva le tue caratteristiche in termini di variabili latenti continue.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.