Come possiamo spiegare la differenza tra la regressione logistica e la rete neurale a un pubblico che non ha esperienza nelle statistiche?
Come possiamo spiegare la differenza tra la regressione logistica e la rete neurale a un pubblico che non ha esperienza nelle statistiche?
Risposte:
Presumo che tu stia pensando a quello che era un tempo, e forse sono ancora chiamati "percetroni multistrato" nella tua domanda sulle reti neurali. In tal caso, spiegherei il tutto in termini di flessibilità riguardo alla forma del confine decisionale in funzione delle variabili esplicative. In particolare, per questo pubblico, non vorrei menzionare le funzioni di collegamento / le probabilità del registro, ecc. Continuate semplicemente con l'idea che la probabilità di un evento sia prevista sulla base di alcune osservazioni.
Ecco una possibile sequenza:
I vantaggi di questo approccio sono che non è necessario entrare nei dettagli matematici per dare l'idea corretta. In realtà non devono già comprendere né la regressione logistica né le reti neurali per comprendere le somiglianze e le differenze.
Lo svantaggio dell'approccio è che devi fare molte foto e resistere con forza alla tentazione di cadere nell'algebra per spiegare le cose.
Per un riepilogo più semplice:
Regressione logistica: la forma più semplice di rete neurale, che si traduce in limiti di decisione che sono una linea retta
Reti neurali: un superset che include la regressione logistica e anche altri classificatori che possono generare limiti di decisione più complessi.
(nota: mi riferisco alla regressione logistica "semplice", senza l'assistenza di kernel integrali)
(riferimento: corsi deeplearning.ai di Andrew Ng, "La regressione logistica come rete neurale" e "Classificazione dei dati planari con un livello nascosto")
Prenderò letteralmente la domanda: qualcuno che non ha esperienza nelle statistiche. E non proverò a dare a quella persona un background nelle statistiche. Ad esempio, supponiamo di dover spiegare la differenza al CEO di un'azienda o qualcosa del genere.
Quindi: la regressione logistica è uno strumento per modellare una variabile categoriale in termini di altre variabili. Ti dà modo di scoprire come i cambiamenti in ciascuna delle "altre" variabili influenzano le probabilità di diversi risultati nella prima variabile. L'output è abbastanza facile da interpretare.
Le reti neurali sono un insieme di metodi per consentire a un computer di provare a imparare dagli esempi in modi che assomigliano vagamente al modo in cui gli umani apprendono le cose. Può provocare modelli che sono buoni predittori, ma di solito sono molto più opachi di quelli della regressione logistica.
Mi è stato insegnato che puoi pensare alle reti neurali (con funzioni logistiche di attivazione) come a una media ponderata delle funzioni logit, con i pesi stessi stimati. Scegliendo un gran numero di logit, puoi adattare qualsiasi modulo funzionale. C'è qualche intuizione grafica nel post del blog di Econometric Sense .
Le altre risposte sono fantastiche. Vorrei semplicemente aggiungere alcune immagini che mostrano che si può pensare alla regressione logistica e alla regressione logistica multi-classe (aka maxent, regressione logistica multinomiale, regressione softmax, classificatore entropia massima) come un'architettura speciale di reti neurali.
Da Sebastian Raschka, Michigan State University, su KDnuggets :
Qualche altra illustrazione per la regressione logistica multi-classe:
Un'illustrazione simile tratta da http://www.deeplearningbook.org/ capitolo 1:
E ancora uno dai tutorial di TensorFlow :
Ad esempio in Caffe , implementeresti la regressione logistica come segue :
Vorrei usare un esempio di un problema complicato ma concreto che il pubblico comprende. Usa nodi nascosti le cui interpretazioni non sono addestrate, ma hanno significati particolari.
Se usi le posizioni degli scacchi (pronosticando se il bianco vincerà), potresti lasciare che gli input siano una rappresentazione della scacchiera (ignora se puoi castellare o catturare en passant, o anche di chi sia la mossa), per esempio input binari che indicano se esiste un pezzo di ciascun tipo su ciascun quadrato.
La regressione lineare determina quanto è bello avere un cavaliere bianco su h4. Potrebbe non essere ovvio che sia buono, ma se è su h4 non è stato catturato, il che probabilmente supera altre considerazioni. La regressione lineare probabilmente recupera i valori approssimativi dei pezzi e che è meglio avere i tuoi pezzi verso il centro del tabellone e sul lato del tabellone del tuo avversario. La regressione lineare non è in grado di valutare combinazioni, ad esempio se la tua regina su b2 è improvvisamente più preziosa se il re avversario è su a1.
Una rete neurale potrebbe avere nodi nascosti per concetti, come "vantaggio materiale", "sicurezza del re nero", "controllo del centro", "entrambe le torri sul d-file", "pedone torre isolato regina" o "vescovo mobilità." Alcuni di questi possono essere stimati solo dagli input della scheda, mentre altri potrebbero dover essere in un secondo o più tardi livello nascosto. La rete neurale può usarli come input per la valutazione finale della posizione. Questi concetti aiutano un esperto a valutare una posizione, quindi una rete neurale dovrebbe essere in grado di effettuare valutazioni più accurate di una regressione lineare. Tuttavia, ci vuole più lavoro per creare la rete neurale poiché devi scegliere la sua struttura e ha molti più parametri da addestrare.