Perché la regressione logistica è chiamata algoritmo di apprendimento automatico?


19

Se ho capito bene, in un algoritmo di apprendimento automatico, il modello deve imparare dalla sua esperienza, ovvero quando il modello fornisce una previsione errata per i nuovi casi, deve adattarsi alle nuove osservazioni e, nel tempo, il modello diventa sempre più migliore . Non vedo che la regressione logistica abbia questa caratteristica. Quindi perché è ancora considerato un algoritmo di apprendimento automatico? Qual è la differenza tra la regressione logistica e la normale regressione in termini di "apprendimento"?

Ho la stessa domanda per le foreste casuali!

E qual è la definizione di "apprendimento automatico"?


4
Ho modificato la tua domanda per chiarezza grammaticale, ma non sono sicuro di ciò che intendi nel complesso ... La regressione logistica rientra nella categoria ML perché è un algoritmo di classificazione. L'apprendimento automatico non implica che l'algoritmo debba essere adattivo (sebbene esistano algoritmi che apprendono da nuove osservazioni). L'adattamento è più una scelta di implementazione, generalmente ottenuta mediante algoritmi di apprendimento automatico generativo che modellano la probabilità congiunta.
Zhubarb,

12
"Apprendimento automatico" è un concetto piuttosto vagamente definito. In realtà, tutte le procedure statistiche che comportano l'adattamento di un modello possono essere pensate all'apprendimento automatico. (Supponendo che il montaggio del modello possa essere fatto da un computer, in una certa misura!). Questo è il motivo per cui alcuni statistici sono frustrati da "big data", "machine learning", ecc. Comunità che confondono le acque su ciò che le statistiche sono (e non sono!)
P.Windridge,


1
@ P.Windridge: se "tutte le procedure statistiche che comportano l'adattamento di un modello possono essere pensate all'apprendimento automatico", quindi non vedo perché dovremmo distinguere l'apprendimento automatico e la statistica
Metariat

4
@XuanQuangDO Probabilmente non dovremmo distinguere l'apprendimento automatico e le statistiche.
Sycorax dice di ripristinare Monica il

Risposte:


21

L'apprendimento automatico non è un termine ben definito.

In effetti, se la "Definizione dell'apprendimento automatico" di Google, le prime due cose che ottieni sono abbastanza diverse.

Da WhatIs.com ,

L'apprendimento automatico è un tipo di intelligenza artificiale (AI) che fornisce ai computer la capacità di apprendere senza essere esplicitamente programmati. L'apprendimento automatico si concentra sullo sviluppo di programmi per computer che possono insegnare a se stessi a crescere e cambiare quando esposti a nuovi dati.

Da Wikipedia ,

L'apprendimento automatico esplora la costruzione e lo studio di algoritmi che possono apprendere e fare previsioni sui dati.

La regressione logistica si adatta indubbiamente alla definizione di Wikipedia e si potrebbe discutere se si adatta o meno alla definizione di WhatIs.

Definisco personalmente l'apprendimento automatico proprio come fa Wikipedia e lo considero un sottoinsieme di statistiche.


1
Sono d'accordo con la maggior parte di ciò che hai detto, tranne per il fatto che si tratta di un sottoinsieme di statistiche. Ha una grande sovrapposizione, ma ci sono tipi di apprendimento, come l'apprendimento per rinforzo, che non può davvero essere considerato un sottoinsieme di statistiche.
George,

2
Queste non sono buone fonti.
Neil G,

@George Giusto, ma ammettiamolo, se hai dovuto applicare un'etichetta a tutte le metodologie di raccolta, analisi e modellazione dei dati, che si tratti di apprendimento automatico, supervisionato o non supervisionato, parametrico o non parametrico, sono tutte statistiche. ML è un campo specializzato in statistica.
RobertF,

@RobertF Non sono d'accordo. L'apprendimento automatico è il campo che studia come le macchine possono imparare. Concordo sul fatto che la maggior parte dei metodi utilizzati in ML possono essere considerati metodi statistici, ma il campo non è intrinsecamente un sottocampo delle statistiche. Ad esempio, non credo che i processi decisionali di Markov siano considerati metodi statistici.
George,

1
@George Tempo discreto I modelli di Markov sono modelli di probabilità. Una volta stimati i parametri sconosciuti di un modello di probabilità (ad esempio i processi decisionali di Markov), ovvero la definizione da manuale di una procedura statistica. Penso che la principale classe di attività che può essere chiamata ML e non le statistiche siano applicazioni specifiche, come la costruzione di un robot che gioca a scacchi. Gli algoritmi sottostanti implicheranno senza dubbio probabilità e statistiche, ma l'applicazione non è in realtà "statistica". Un po 'come la ricerca genomica usa pesantemente le statistiche, ma sono campi decisamente diversi.
Ahfoss,

20

L'apprendimento automatico è caldo ed è dove sono i soldi. Le persone chiamano cose che stanno cercando di vendere ciò che è caldo in questo momento e quindi "vende". Questo può vendere software. Può vendersi come impiegati attuali che cercano di essere promossi, come potenziali impiegati, come consulenti, ecc. Che può essere un manager che cerca di ottenere l'approvazione del budget da una società bigwig per assumere persone e comprare cose o per convincere gli investitori a investire in la sua nuova hot startup che fa di Machine Learning la chiave per creare un'app sexting migliorata. Quindi il software fa Machine Learning e le persone sono esperti di Machine Learning, perché questo è ciò che è caldo e quindi ciò che vende ... almeno per ora.

Ho fatto tutti i tipi di modelli statistici lineari e non lineari adattandoli più di 30 anni fa. Allora non si chiamava Machine Learning. Ora, la maggior parte sarebbe.

Proprio come tutti e suo zio sono ora uno "scienziato" di dati. È caldo, è presumibilmente sexy, quindi è quello che le persone si definiscono. Ed è quello che assumono i manager che devono ottenere l'approvazione del budget per assumere posizioni nell'elenco di qualcuno. Quindi qualcuno che non conosce la prima cosa su matematica, probabilità, statistica, ottimizzazione o calcolo numerico / in virgola mobile, utilizza un pacchetto R o Python di dubbia correttezza e solidità dell'implementazione, che è etichettato come algoritmo di Machine Learning, applicare ai dati che non comprendono e definirsi un Data Scientist in base alla loro esperienza nel farlo.

Questo può sembrare irriverente, ma credo che sia l'essenza della situazione.

Modificare: segue è stato twittato il 26 settembre 2019:

https://twitter.com/daniela_witten/status/1177294449702928384

Daniela Witten @daniela_witten "Quando raccogliamo denaro è AI, quando assumiamo è machine learning, e quando facciamo il lavoro è regressione logistica."

(Non sono sicuro di chi sia venuto fuori con questo, ma è una gemma 💎)


16
Non nascondo che condivido alcune di queste opinioni e sono solidale con il resto. Tuttavia, per essere appropriati come risposta su un sito SE devono avere un qualche tipo di supporto. Ovviamente ciò non avverrà attraverso il ragionamento deduttivo: deve provenire dall'addizione di fatti e / o dalla citazione di fonti autorevoli. Sarebbe bello se tu potessi farlo!
whuber

10
Facilmente il post più divertente che ho letto oggi su questo sito, e sono d'accordo con gran parte di esso. Ma devo essere d'accordo con @whuber sul fatto che non risponda realmente alla domanda nella sua forma attuale.
Nick Cox,

6
Come un piccolo chiarimento. Lavoro sia nello sviluppo di software che nella malvagia "Data Science". Intervisto molte persone. Il tasso di interviste per posizioni di sviluppo software e posizioni di data science che non hanno le competenze per svolgere il lavoro è più o meno lo stesso. Quindi cosa c'è di speciale nel titolo di data science? Le persone aumenteranno le proprie capacità in tutte le discipline tecniche. Sono sicuro che la programmazione dello scambio di stack ha molte delle stesse lamentele.
Matthew Drury,

7
Sembra più una sfuriata che una risposta. Certo, i nomi cambiano, il marchio è importante e l'apprendimento automatico è caldo (e quindi ha molti professionisti autoproclamati che non sanno cosa stanno facendo). Tuttavia, usarlo come argomento per minimizzare un campo che è diventato consolidato e molto rilevante sia nella ricerca che nell'industria mi sembra economico.
Marc Claesen,

7
@ MarkL.Stone Capisco la tua situazione e sono completamente d'accordo sul fatto che ci sono molti termini di inserimento incompetenti qui fuori. Tuttavia, a mio avviso, il fatto che tali persone trovino (e mantengano!) Posti di lavoro è colpa della direzione. Se i manager non sono soddisfatti dei risultati degli analisti e trattano tutti gli analisti allo stesso modo indipendentemente dalle capacità / risultati individuali, la gestione è ugualmente incompetente come i cattivi analisti. Qualsiasi lavoro che ha un profumo di denaro ha dei ciarlatani, prendi la medicina per esempio. Ampie generalizzazioni su data scientist / ragazzi di machine learning sono cattive quanto diffidare di tutti gli analisti.
Marc Claesen,

18

Come altri hanno già detto, non esiste una chiara separazione tra statistica, apprendimento automatico, intelligenza artificiale e così via, quindi prendi qualsiasi definizione con un pizzico di sale. La regressione logistica è probabilmente più spesso etichettata come statistica piuttosto che come apprendimento automatico, mentre le reti neurali sono in genere etichettate come apprendimento automatico (anche se le reti neurali sono spesso solo una raccolta di modelli di regressione logistica).

A mio avviso, l'apprendimento automatico studia metodi che possono in qualche modo imparare dai dati, in genere costruendo un modello in qualche forma o forma. La regressione logistica, come SVM, reti neurali, foreste casuali e molte altre tecniche, impara dai dati durante la costruzione del modello.

Se ho capito bene, in un algoritmo di Machine Learning, il modello deve imparare dalla sua esperienza

Non è proprio così che viene generalmente definito l'apprendimento automatico. Non tutti i metodi di apprendimento automatico producono modelli che si adattano dinamicamente a nuovi dati (questo sottocampo si chiama apprendimento online ).

Qual è la differenza tra la regressione logistica e la normale regressione in termini di "apprendimento"?

Molti metodi di regressione sono anche classificati come apprendimento automatico (ad es. SVM).


2
Si noti che l'apprendimento senza supervisione è ancora chiamato apprendimento (automatico), quindi non è necessario disporre di un ciclo di feedback per classificare qualcosa come "apprendimento automatico".
vsz,

Questo non è sull'argomento della domanda, ma questa risposta menziona anche la separazione tra AI e ML. Mi è sempre piaciuta questa definizione di AI: en.wikipedia.org/wiki/…
Davis Yoshida,

10

La regressione logistica è stata inventata dallo statistico DR Cox nel 1958 e quindi precede il campo dell'apprendimento automatico. La regressione logistica non è un metodo di classificazione, grazie al cielo. È un modello di probabilità diretto.

Se pensi che un algoritmo debba avere due fasi (ipotesi iniziale, quindi "correggere" gli errori "di predizione"), considera questo: la regressione logistica lo fa bene la prima volta. Cioè, nello spazio dei modelli additivi (nel logit). La regressione logistica è un diretto concorrente di molti metodi di apprendimento automatico e supera molti di essi quando i predittori agiscono principalmente in modo additivo (o quando la conoscenza della materia predispone correttamente le interazioni). Alcuni definiscono la regressione logistica un tipo di apprendimento automatico, ma la maggior parte no. Potresti chiamare alcuni metodi statistici di apprendimento automatico (le reti neurali sono esempi).


1
Stranamente il servizio di machine learning di Amazon utilizza solo un algoritmo (afaik) - regressione logistica - per le attività di classificazione : p aws.amazon.com/machine-learning/faqs
stmax

Potresti semplicemente presentare i dati in modo incrementale, come in un problema di apprendimento online . In tal caso, la regressione logistica non "fa bene la prima volta". Imparo progressivamente. Ha una perdita standard e il suo aggiornamento è un'applicazione standard di discesa gradiente. La regressione logistica è presente in tutti i libri di testo di apprendimento automatico che ho visto.
Neil G,

1
Il fatto che sia possibile campionare i dati in modo incrementale può applicarsi a qualsiasi stimatore, anche se una media, quindi tenerli separati. In un metodo come i modelli logistici in cui la prima e la seconda derivata della funzione di verosimiglianza log sono disponibili in modo analitico, basta usare il metodo ultra veloce Newton-Raphson con step-dimezzare per stimareβcon le stime iniziali impostate su zero tranne l'intercetta.
Frank Harrell,

@FrankHarrell: Esatto, ed è così che procede la stima della massima probabilità della soluzione di un problema di regressione logistica.
Neil G,

La regressione logistica può precedere il termine "Machine Learning", ma non precede il campo : SNARC è stato sviluppato nel 1951 ed era una macchina per l'apprendimento . Inoltre, l'insistenza sul fatto che la regressione logistica modella solo le probabilità e non è, di per sé, un classificatore, è una spaccatura. Secondo tale logica, una rete neurale non è un classificatore (a meno che lo strato di output non sia costituito da neuroni binari, ma ciò renderebbe impossibile la backpropagation).
Igor F.

8

Dovrò essere in disaccordo con la maggior parte delle risposte qui e affermare che Machine Learningha una portata molto precisa e una netta distinzione dalle statistiche. ML è un sottocampo dell'informatica con una lunga storia, che solo negli ultimi anni ha trovato applicazioni al di fuori del suo dominio. Il campo paterno e il dominio applicativo di ML si trovano all'interno dell'intelligenza artificiale (robotica, software di riconoscimento dei modelli, ecc.), Pertanto, non è solo un "termine" come "Big Data" o "Data Science". La statistica, invece, (che deriva dalla parola "stato") è stata sviluppata all'interno delle scienze sociali ed economiche come uno strumento per l'uomo, non per le macchine. La ML si è evoluta separatamente dalle statistiche e, sebbene da qualche parte lungo il modo in cui ha iniziato a fare molto affidamento sui principi statistici, non è affatto un sottocampo delle statistiche. ML e statistiche sono campi complementari, non sovrapposti.

Risposta lunga :

Come implica il suo nome, sono stati realizzati metodi ML per software / macchine, mentre sono stati realizzati metodi statistici per l'uomo. Sia la ML che la statistica si occupano delle previsioni sui dati, tuttavia, i metodi ML seguono un approccio automatizzato non parametrico, mentre i metodi statistici richiedono molto lavoro manuale di costruzione di modelli con un ulteriore fattore esplicativo. Ciò ha perfettamente senso se si considera che gli algoritmi ML sono stati sviluppati nella ricerca sull'IA come mezzo di previsione automatizzata che doveva essere integrata nel software di robotica (ad esempio ai fini del riconoscimento vocale e del volto). Quando una "macchina" fa una previsione, non gliene importa nulla dei motivi. A una macchina non interessa conoscere i driver / predittori alla base di un modello che classifica le e-mail come spam o non-spam, si preoccupa solo di avere la migliore precisione di previsione.scatole nere , non è perché non hanno un modello, è perché il modello è costruito in modo algoritmico e non è pensato per essere visibile né all'uomo né alla macchina.

Il concetto di "formazione" in ML si basa sul potere computazionale, mentre la costruzione di modelli statistici con metodi di tipo OLS per la stima dei parametri si basa sulla conoscenza di un esperto umano. In uno scenario di regressione multipla, spetta allo statistico utilizzare il proprio giudizio di esperti per scegliere il suo modello e verificare tutti i presupposti statistici richiesti. L'obiettivo di uno statistico non è solo quello di trovare modelli e usarli per le previsioni, ma anche di comprendere i suoi dati e il suo problema in una profondità molto maggiore rispetto a ML.

Ovviamente in alcune occasioni ML e statistiche si sovrappongono, come nel caso di molte discipline. La regressione logistica è una di queste occasioni; originariamente un metodo statistico, che assomiglia così tanto al semplice Perceptron (una delle tecniche ML fondamentali), che per alcuni è visto come un metodo ML.


1
Forse non hai mai sentito parlare di statistiche non parametriche e modelli statistici non parametrici e costruzione di modelli?
Mark L. Stone,

1
Sì, utilizzo statistiche non parametriche su base giornaliera. Non ho detto che ML è la risposta non parametrica alle statistiche, trovo solo che i metodi ML non parametrici si presentano come un effetto collaterale. La statistica non parametrica è un'opzione alternativa dello statistico quando le statistiche parametriche falliscono, ma è comunque il risultato della scelta consapevole di un esperto. Probabilmente non sono abbastanza chiaro nel comunicare la mia opinione e per questo mi scuso.
Digio,

3
Ci sono molti statistici che fanno continuamente modelli non parametrici, statistiche. Hai mai sentito parlare della probabilità empirica - inventata da uno statistico, usata dagli statistici e abbastanza non parametrica, sebbene possa anche essere usata in modo semi-parametrico. Quindi non sono d'accordo con te, ma non ti ho votato.
Mark L. Stone,

1
In disaccordo va bene, Mark, ma ancora non capisco di cosa tratta la tua contro argomentazione. Stai insinuando che le statistiche non parametriche non hanno bisogno dell'apprendimento automatico (qualcosa che non ho mai negato)? O stai affermando che l'apprendimento automatico è in realtà solo un altro nome per le statistiche non parametriche (qualcosa che ho negato)?
Digio,

3
C'è molto in disaccordo qui. I modelli di regressione multivariabile, se usati insieme ai moderni strumenti statistici, possono essere flessibili e altamente competitivi con ML.
Frank Harrell

3

L'apprendimento automatico è definito in modo abbastanza approssimativo e hai ragione nel pensare che i modelli di regressione - e non solo quelli di regressione logistica - anche "apprendono" dai dati. Non sono davvero sicuro se questo significhi che l'apprendimento automatico è davvero statistica o la statistica è davvero apprendimento automatico - o se qualcosa di tutto ciò conta.

Tuttavia, non credo sia necessario che un algoritmo apprenda ripetutamente dai suoi errori. La maggior parte dei metodi usa un set di addestramento per calcolare alcuni parametri e quindi usa questi parametri fissi per fare previsioni su alcuni dati di test aggiuntivi. Il processo di formazione può comportare l'aggiornamento ripetuto dei parametri (come in backpropagation), ma non necessariamente (K- i vicini più vicini non fanno nulla durante l'allenamento!). In ogni caso, al momento del test, potresti non avere nemmeno accesso ai dati di verità.

Detto questo, alcuni algoritmi imparano dagli errori di predizione - questo è particolarmente comune in rinforzo , in cui un agente prende alcune azioni, ne osserva i risultati e quindi usa i risultati per pianificare azioni future. Ad esempio, un vuoto robotico potrebbe iniziare con un modello del mondo in cui pulisce tutte le posizioni allo stesso modo spesso, e quindi imparare a aspirare i luoghi sporchi (dove viene "ricompensato" trovando lo sporco) di più e pulire i luoghi di meno.

Gli algoritmi online o incrementali possono essere ripetutamente aggiornati con nuovi dati di allenamento. Ciò non dipende necessariamente dall'accuratezza della previsione del modello, ma potrei immaginare un algoritmo in cui i pesi vengono aggiornati in modo più aggressivo se, ad esempio, i nuovi dati sembrano molto improbabili rispetto al modello attuale. Esistono versioni online per la regressione logistica: ad esempio, McMahan e Streeeter (2012) .


3

Alla fine l'ho capito. Ora conosco la differenza tra adattamento del modello statistico e apprendimento automatico.

  • Se si adatta un modello (regressione), si tratta di adattamento del modello statistico
  • Se impari un modello (regressione), questo è l'apprendimento automatico

Quindi, se impari una regressione logistica, questo è un algoritmo di apprendimento automatico.

Commento: Scusatemi per essere un vecchio geezer, ma ogni volta che sento persone che parlano dell'apprendimento di un modello o dell'apprendimento di una regressione, mi viene in mente Jethro "Ho imparato un'educazione".

FINE DEL FILO


??? Posso anche imparare un modello logistico, di cosa stai parlando?
SmallChess

1
@Student T, se si adatta un modello logistico, ovvero adattamento del modello statistico. Se impari un modello logistico, questo è l'apprendimento automatico, vale a dire la questione della terminologia utilizzata dai diversi campi. La stessa cosa può essere chiamata cose diverse da campi diversi (Statistica e Machine Learning).
Mark L. Stone,

0

La regressione logistica (e più in generale GLM) NON appartiene all'apprendimento automatico! Piuttosto, questi metodi appartengono alla modellazione parametrica .

Sia parametrico che algoritmico modelli (ML) utilizzano i dati, ma in modi diversi . I modelli algoritmici apprendono dai dati come i predittori mappano al predittore, ma non fanno alcuna ipotesi sul processo che ha generato le osservazioni (né qualsiasi altra ipotesi, in realtà). Considerano che le relazioni sottostanti tra le variabili di input e output sono complesse e sconosciute e, quindi, adottano un approccio basato sui dati per capire cosa sta succedendo, piuttosto che imporre un'equazione formale.

D'altro canto, modelli parametrici sono prescritti a priori sulla base di una certa conoscenza del processo studiato, usano i dati per stimare i loro parametri e fanno molte ipotesi non realistiche che raramente valgono in pratica (come l'indipendenza, la varianza uguale e Distribuzione normale degli errori).

Inoltre, i modelli parametrici (come la regressione logistica) sono modelli globali . Non possono acquisire modelli locali nei dati (a differenza dei metodi ML che utilizzano gli alberi come modelli di base, ad esempio RF o Boosted Trees). Vedi questo articolo a pagina 5. Come strategia di riparazione, è possibile utilizzare GLM locale (cioè non parametrico) (vedere ad esempio il pacchetto locfit R).

Spesso, quando sono disponibili poche conoscenze sul fenomeno di base, è meglio adottare un approccio basato sui dati e utilizzare la modellistica algoritmica. Ad esempio, se si utilizza la regressione logistica in un caso in cui l'interazione tra le variabili di input e output non è lineare, il modello sarà chiaramente inadeguato e molti segnali non verranno acquisiti. Tuttavia, quando il processo è ben compreso, i modelli parametrici hanno il vantaggio di fornire un'equazione formale per riassumere tutto, che è potente da un punto di vista teorico.

Per una discussione più dettagliata, leggi questo eccellente documento di Leo Breiman.


4
Si prega di prendere il tempo per capire la regressione logistica. Non fa alcuna ipotesi distributiva. Fa esattamente lo stesso tipo di ipotesi di indipendenza fatta da ML. ML richiede campioni molto più grandi della regressione logistica. Ad esempio, foreste casuali e SVM possono richiedere che 200 eventi per funzionalità candidata siano stabili mentre la regressione logistica richiede in genere 200 eventi per variabile candidata.
Frank Harrell,

2
Dovresti prenderti il ​​tempo per capire la regressione logistica! È un modello lineare generalizzato in cui il collegamento è la funzione logit. È parametrico. Presuppone che le osservazioni siano IID. Inoltre, buona fortuna con l'acquisizione di relazioni non lineari. Inoltre, cosa significa la seconda parte della frase? Per me, una caratteristica è una variabile (?)
Antoine,

5
Ci sono molti buoni libri sull'argomento e ti consiglio di consultarli prima di procedere. La regressione logistica non assume distribuzioni identiche e in effetti non assume alcuna distribuzione. A meno che non sia possibile dimostrare come si tiene conto della struttura di correlazione nella ML, entrambi gli approcci assumono l'indipendenza. Le spline di regressione sono utilizzate dal 1982 per allentare le ipotesi di linearità nella regressione logistica. Per questa discussione caratteristica = variabile a meno che non sia espansa in una spline.
Frank Harrell,

5
Breiman ha capito bene le cose. Non si è occupato degli sviluppi post regressione logistica del 1982, ad esempio la stima della massima probabilità penalizzata, le spline di regressione e le combinazioni con i metodi di riduzione dei dati. L'unica grave limitazione alla regressione logistica è che come altri metodi non è buono nel trovare le giuste interazioni se si cercano interazioni e non sono pre-specificate. La maggior parte dei metodi che pretendono di essere in grado di farlo non danno risultati replicabili. Inoltre, Breiman ha utilizzato un punteggio di precisione improprio che può essere ottimizzato da un modello falso.
Frank Harrell,

3
@Antoine: "perché la regressione logistica differisce radicalmente dalla ML". Si noti che alcuni metodi in ML (in particolare, SVM) sono molto legati alla regressione logistica. Con l'eccezione di interazioni multiple - come Frank ha scritto - il registro logistico con non linearità e penalizzazione dà risultati molto simili a SVM e altri metodi ML. Continua a stupirmi di come alcuni articoli citino miglioramenti delle prestazioni basati su un metodo ML rispetto a un modello logistico stat101 per inquadrare negativamente la regressione logistica.
Thomas Speidel,

-1

Penso che le altre risposte facciano un buon lavoro nell'identificare più o meno cos'è l'apprendimento automatico (come indicano, può essere una cosa confusa). Aggiungerò che la regressione logistica (e la sua versione multinomiale più generale) è molto comunemente usata come mezzo per eseguire la classificazione nelle reti neurali artificiali (che penso siano inequivocabilmente coperte da qualsiasi definizione di apprendimento automatico ragionevole che si sceglie), e quindi se si menziona Regressione logistica verso una persona neurale netta, è probabile che la pensino immediatamente in questo contesto. Essere legato a un forte battitore nell'apprendimento automatico è un buon modo per diventare tu stesso una tecnica di apprendimento automatico, e penso che in qualche modo sia quello che è successo con varie tecniche di regressione, anche se non le escluderei dall'essere tecniche di apprendimento automatico adeguate in se stessi.


Si noti che la regressione logistica non è un classificatore ma un metodo di stima della probabilità diretta.
Frank Harrell,

Per ulteriori informazioni sul punto del Dr. Harrell, consultare il mio post qui. stats.stackexchange.com/questions/127042/…
Sycorax dice

@FrankHarrell Possiamo anche usare la probabilità per la classificazione, quindi è davvero un classificatore.
SmallChess,

@ StudentT4 Non potrebbe essere più errato. If è uno stimatore di probabilità diretto. Il modo in cui usi il risultato finale del modello logistico dipende da te. Secondo la tua logica, la media di esempio è un classificatore.
Frank Harrell,

-1

Penso che qualsiasi procedura "iterativa" possa essere considerata un caso di apprendimento automatico. La regressione può essere considerata apprendimento automatico. Potremmo farlo a mano, ma ci vorrebbe molto tempo, se possibile. Quindi ora abbiamo questi programmi, macchine, che fanno le iterazioni per noi. Si avvicina sempre di più a una soluzione, o alla migliore soluzione o alla migliore soluzione. Pertanto, "apprendimento automatico". Naturalmente cose come le reti neurali attirano la maggior parte dell'attenzione sull'apprendimento automatico, quindi di solito associamo l'apprendimento automatico a queste procedure sexy. Inoltre, la differenza tra l'apprendimento automatico "supervisionato" e "non supervisionato" è rilevante qui


-2

È un errore molto comune che molte persone fanno e posso vederlo anche qui (fatto da quasi tutti). Lascia che lo spieghi in dettaglio ... Regressione logistica e modello di regressione lineare, entrambi sono modello parametrico e tecnica di apprendimento automatico. Dipende solo dal metodo che si sta utilizzando per stimare i parametri del modello (theta). Esistono 2 modi per trovare i parametri del modello in Regressione lineare e Reg. Logistico.

  1. Tecnica di discesa a gradiente : qui iniziamo assegnando valori casuali ai parametri e troviamo la funzione di costo (errore). In ogni iterazione aggiorniamo i nostri parametri e minimizziamo la funzione di costo. Dopo un certo numero di iterazioni, la funzione di costo ridotta ai valori desiderati e i valori dei parametri corrispondenti sono i nostri valori finali. Questo è ciò che dovrebbe fare una tecnica di apprendimento automatico. Pertanto, se si utilizza la tecnica Discesa gradiente, la regressione logistica può essere definita come una tecnica di apprendimento automatico.

  2. Usando il metodo del minimo quadrato: qui abbiamo una formula diretta per trovare i nostri parametri (è necessaria una certa algebra di matrice per comprendere la derivazione di questa formula) che è conosciuta come equazione normale. Metodo del minimo quadrato

Qui b rappresenta i parametri X è Matrix design. Entrambi i metodi hanno i loro vantaggi e limiti. Per maggiori dettagli: segui il corso di Machine Learning coursera ancora in corso.

Spero che questo post possa essere utile .. :-)

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.