Puoi scrivere un software per:
- Prendi le parole chiave dall'espressione regolare;
- Google le parole chiave e ottenere un elenco di risultati;
- Eseguire la scansione di ciascun URI risultante e filtrarlo con espressione regolare completa.
Studiamo un caso: da site:gog.com
trovare tutti i giochi con voice over spagnolo.
L'espressione regolare è:
Audio[^:]*:[^.,]*Spanish
Deve corrispondere, ad esempio:
Audio lanuage: English, German, Spanish, French.
E non abbinare:
Audio language: only-English. Text language: Spanish.
Passaggio 1. Consenti al tuo software di cercare questo su Google:
site:gog.com audio Spanish inurl:game
inurl:game
qui significa cercare solo nelle pagine descrittive del gioco
Passaggio 2. Ottieni i 300 link risultanti ed esegui la scansione in ognuno di essi.
Passaggio 3. Filtra il risultato con l'espressione regolare fornita:
Audio[^:]*:[^.,]*Spanish
Questo dovrebbe essere facile da costruire. In realtà non capisco perché non sono riuscito a trovare qualcosa che è già stato costruito in quel modo.
Poiché i motori di ricerca non possono permettersi la risorsa per scansionare i loro dati con espressione regolare, questo sporco lavoro ricade su di te e il tuo computer dovrebbe farlo con quello che già forniscono i motori di ricerca.