Quindi ho un set di dati che vorrei rimuovere dall'uso delle parole di arresto
stopwords.words('english')
Sto lottando su come usarlo nel mio codice per estrarre semplicemente queste parole. Ho già un elenco delle parole da questo set di dati, la parte con cui sto lottando è il confronto con questo elenco e la rimozione delle parole di arresto. Qualsiasi aiuto è apprezzato.
from nltk.corpus import stopwords
per i futuri googler
nltk.download("stopwords")
per rendere disponibile il dizionario delle parole non significative.