È più veloce cercare termini di ricerca lunghi o brevi? O influenza la velocità? In altre parole, dovresti rendere i termini di ricerca il più esatti possibile?
Esistono più di 100000 file e ogni file contiene tra 20 e più di 5000 righe di dati. Di solito grep è usato per trovare solo un'istanza del termine di ricerca.
Supponiamo che il termine di ricerca sia SEARCHTERM
, e sarà in una riga come questo:
NAD+DP+1234567890:92++UNIQUE+NAME+SEARCHTERM++12345+FI'
È più veloce cercare "RICERCA" o "RICERCA"? Diciamo che in questo caso non ci interessa se troviamo anche corrispondenze in altre linee non correlate.
Ecco come lo faccio attualmente:
grep NAD+DP 123* | grep SEARCHTERM
Ma lo trovo abbastanza lento, fermo. Di solito ci vogliono circa 3-5 minuti per trovare i dati, anche quando conosco il nome del file approssimativo, che limita l'intervallo a circa 10.000 file.
Quindi, sarebbe utile un termine di ricerca più lungo o più breve? Per quanto ne so, grep cerca "blocchi" di parole di una certa lunghezza?