Un approccio tradizionale alla costruzione di feature per l'estrazione del testo è l'approccio bag-of-words e può essere migliorato usando tf-idf per impostare il vettore di feature che caratterizza un determinato documento di testo. Al momento, sto cercando di utilizzare il modello di linguaggio bi-gram o (N-gram) per creare il vettore di feature, ma non sai come farlo? Possiamo semplicemente seguire l'approccio del bag-of-word, cioè calcolare il conteggio delle frequenze in termini di bi-grammo anziché parole e migliorarlo usando lo schema di ponderazione tf-idf?