Ho un insieme di elementi che posso descrivere in base a caratteristiche. Così:
dove è la valutazione (numerica) per l'elemento secondo le caratteristiche . Quindi i miei elementi possono essere visualizzati come punti in uno spazio di dimensioni.
Secondo le mie letture, esistono algoritmi come il "Classificatore di Bayes" che può fornirmi un tipo di risposta "sì" o "no" su qualsiasi elemento del mio set, a condizione che io abbia usato un "set di addestramento" costituito da alcuni elementi del mio set e il risultato atteso dell'algoritmo. Sulla base di tali dati, l'algoritmo dovrebbe essere in grado di prendere qualsiasi altro elemento, non parte del set di training, e fornire una risposta "sì" o "no" basata su ciò che ha appreso grazie al set di training. Questo è fantastico se hai qualche tipo di idea di cosa ti aspetti (set di allenamento) ma non sei sicuro delle regole specifiche che portano a quel risultato.
Quello che vorrei fare con i miei dati non è ottenere un tipo di risposta "sì" o "no", ma vorrei introdurre una classifica all'interno degli elementi. Alcuni di loro sono "migliori" di altri. Proprio come per il filtro Bayes, ho un'idea generica di cosa mi aspetto. Potrei così generare una "classifica di formazione" tratta da un sottoinsieme dei miei elementi, che inserirò nel MLA. Sulla base di quell'allenamento sarebbe in grado di classificare il mio intero set.
Per fare ciò vedo due approcci:
- A ciascun elemento verrebbe assegnato un punteggio dall'MLA, quindi classificarli in base al punteggio.
- L'MLA sarebbe in grado di prendere due elementi e e determinare quale è meglio (confronti a coppie). Usa quicksort usando quell'operazione di confronto.
Nota: in base a un punteggio la funzione a coppie è banale da implementare e, in base a una funzione a coppie, è banale generare un punteggio, quindi questi sono solo due approcci per ottenere gli stessi risultati.
Esistono esempi di MLA che possono fornire una funzione di punteggio o una funzione di confronto a coppie?
EDIT: Al fine di aggiungere più contesto: attualmente i miei oggetti sono classificati secondo un algoritmo che genera un punteggio (numero reale) per ogni articolo effettuando calcoli sul . Mentre la classifica generata è abbastanza corretta, spesso devo modificare l'algoritmo per modificarlo in qualche modo perché posso vedere chiaramente alcuni elementi che non sono classificati in base a quello che mi sarei aspettato.
Quindi attualmente il mio processo di progettazione è:
- Fatti un'idea di quale sarebbe una classifica perfetta
- Prova a derivare (manualmente) un algoritmo che classificherebbe gli oggetti in questo modo
- Osservare i risultati
- Adatta l'algoritmo
Quindi ho pensato agli MLA poiché il punto di partenza del mio processo è quello che potrebbe essere usato come dati di addestramento. Probabilmente inizierei prendendo l'attuale rango, scambiando gli oggetti in base alle mie esigenze e alimentandolo.