Trascurando possibili restrizioni computazionali, esistono applicazioni generali in cui la lemmatizzazione sarebbe un passo controproducente durante l'analisi dei dati di testo?
Ad esempio, la lemmatizzazione sarebbe qualcosa che non si fa quando si costruisce un modello sensibile al contesto?
Per riferimento, la lemmatizzazione per dictinory.com è l'atto di raggruppare le forme flesse di (una parola) per l'analisi come un singolo oggetto.
Ad esempio, la parola "cucinare" è il lemma della parola "cucinare". L'atto di lemmatizzazione è, ad esempio, la sostituzione della parola cottura con cuoco dopo aver tokenizzato i dati del testo. Inoltre, la parola "peggio" ha "cattivo" come suo lemma, e come l'esempio precedente che sostituisce la parola "peggio" con "cattivo" è l'azione della lemmatizzazione.