Ho un file di testo contenente tweet e sono tenuto a contare il numero di volte in cui una parola viene menzionata nel tweet. Ad esempio, il file contiene:
Apple iPhone X is going to worth a fortune
The iPhone X is Apple's latest flagship iPhone. How will it pit against it's competitors?
E diciamo che voglio contare quante volte la parola iPhone è menzionata nel file. Quindi ecco cosa ho provato.
cut -f 1 Tweet_Data | grep -i "iPhone" | wc -l
certamente funziona ma sono confuso riguardo al comando 'wc' in unix. Qual è la differenza se provo qualcosa del genere:
cut -f 1 Tweet_Data | grep -c "iPhone"
dove viene usato -c invece? Entrambi producono risultati diversi in un file di grandi dimensioni pieno di tweet e sono confuso su come funziona. Quale metodo è il modo corretto di contare l'occorrenza?
cut -f1
sta tagliando in base alle schede, che qui non sta facendo molto. Sei sicuro che tiwc -l
stia davvero dando il conto corretto? Mostrerebbe 2 qui, ma conto 3 istanze di "iPhone".