Risposte:
Con Cygwin (o l'accesso a una macchina Linux) potresti farlo
antiword file.doc | grep "my phrase"
o
catdoc file.doc | grep "my phrase"
Ci sono molti convertitori di formati di file da riga di comando là fuori per grep in modo simile.
La soluzione puramente in-Word potrebbe essere Ctrl + F (Trova), quindi Trova tutto - tuttavia, non sono sicuro che tutte le versioni di MS Word abbiano il pulsante Trova tutto .
catdoc
segfaults su ogni .doc
/ .docx
file che do, e antiword
mi dice solo che il mio documento "non è un documento di Word". Conosci altre opzioni?
docx2txt
esiste nei repository Debian - potrebbe funzionare. Esaminerei anche l'utilità di conversione del formato della riga di comando di OpenOffice / LibreOffice (unoconv), che potrebbe essere utilizzata per lo stesso scopo.
Cosa significa "linea" in un contesto di Word? La riga visualizzata, che cambia se fai qualcosa per la formattazione della pagina? Il paragrafo? Qualcos'altro?
Puoi fare un sacco di cose con le funzioni di ricerca e sostituzione di Word, tra cui la modifica della formattazione e altre cose non ovvie, ma tutte agiranno solo sul testo find-what stesso, non su qualsiasi testo circostante.
PowerGREP farà esattamente questo per te e in fretta - ma non gratuitamente. Secondo me vale ogni centesimo. Inoltre, c'è una prova gratuita di 30 giorni.
Non ho abbastanza rappresentante per commentare, ma posso vedere questo problema doc vs docx discusso in modo che chiunque insegua il thread (come fossi io) possa trovare utile questo.
Non è necessario uno strumento speciale per i file docx. docx sono file XML compressi.
Per estrarre e rimuovere l'XML, provare qualcosa in base
unzip -p "*.docx" word/document.xml | sed -e 's/<[^>]\{1,\}>//g; s/[^[:print:]]\{1,\}//g'
dalla riga di comando fu
Soluzione veloce, gratuita, open source e multipiattaforma: https://github.com/phiresky/ripgrep-all