Ho bisogno di classificazione o regressione per prevedere la disponibilità di un utente date alcune funzionalità?


9

Durante lo studio dei metodi di data mining ho capito che esistono due categorie principali:

  • Metodi predittivi:

    • Classificazione
    • Regressione
  • Metodi descrittivi:

    • Clustering
    • Regole di associazione

Dal momento che voglio prevedere la disponibilità dell'utente (output) in base a posizione, attività, livello della batteria (input per il modello di training), penso sia ovvio che sceglierei "Metodi predittivi", ma ora non riesco a scegliere tra classificazione e regressione. Da quello che ho capito finora, la classificazione può risolvere il mio problema, perché l'output è "disponibile" o "non disponibile".

La classificazione può fornirmi la probabilità (o la probabilità) che l'utente sia disponibile o non disponibile?

Come nell'output non sarebbe solo 0 (non disponibile) o 1 (per disponibile), ma sarà qualcosa del tipo:

  • 80% disponibile
  • 20% non disponibile

Questo problema può essere risolto anche con la regressione?

8080%20%

Risposte:


6
  1. Sì. Ad esempio, la popolare regressione softmax ti dà la distribuzione di probabilità per ogni classe.
  2. Sì. Softmax è una regressione rispetto a un insieme di classi discrete.

Possiamo usare la regressione per la classificazione, la strategia più comune è quella di prendere la classe più probabile per la previsione.


1

Sì, puoi utilizzare la classificazione o la regressione in base alle tue esigenze di output,

Se si desidera un output etichettato, come disponibile o non disponibile, è necessario utilizzare la classificazione.

Se si desidera l'output sotto forma di% di disponibilità, è necessario utilizzare la regressione.


Puoi supportarlo con fonti da qualche parte?
Mithical

-1

È possibile utilizzare la classificazione di bayes ingenui e calcolare le probabilità posteriori utilizzando credenze precedenti o la regressione logistica può essere utilizzata con la funzione sigmoide.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.