Durante lo studio dei metodi di data mining ho capito che esistono due categorie principali:
Metodi predittivi:
- Classificazione
- Regressione
Metodi descrittivi:
- Clustering
- Regole di associazione
Dal momento che voglio prevedere la disponibilità dell'utente (output) in base a posizione, attività, livello della batteria (input per il modello di training), penso sia ovvio che sceglierei "Metodi predittivi", ma ora non riesco a scegliere tra classificazione e regressione. Da quello che ho capito finora, la classificazione può risolvere il mio problema, perché l'output è "disponibile" o "non disponibile".
La classificazione può fornirmi la probabilità (o la probabilità) che l'utente sia disponibile o non disponibile?
Come nell'output non sarebbe solo 0 (non disponibile) o 1 (per disponibile), ma sarà qualcosa del tipo:
- disponibile
- non disponibile
Questo problema può essere risolto anche con la regressione?