Nel contesto di Machine Learning , ho visto molto spesso il termine Ground Truth . Ho cercato molto e ho trovato la seguente definizione in Wikipedia :
Nell'apprendimento automatico, il termine "verità di base" si riferisce all'accuratezza della classificazione del set di addestramento per le tecniche di apprendimento supervisionato. Questo è usato nei modelli statistici per dimostrare o confutare le ipotesi di ricerca. Il termine "fondamento di verità" si riferisce al processo di raccolta dei dati oggettivi (verificabili) adeguati per questo test. Confronta con gold standard.
Il filtro antispam bayesiano è un esempio comune di apprendimento supervisionato. In questo sistema, all'algoritmo vengono insegnate manualmente le differenze tra spam e non spam. Ciò dipende dalla verità di base dei messaggi utilizzati per addestrare l'algoritmo: le inesattezze nella verità di base saranno correlate alle inesattezze nei verdetti di spam / non spam risultanti.
Il punto è che non riesco davvero a capire cosa significhi. È l' etichetta utilizzata per ciascun oggetto dati o la funzione di destinazione che fornisce un'etichetta a ciascun oggetto dati o forse qualcos'altro?