È possibile effettuare ricerche nei siti MediaWiki usando espressioni regolari?


9

Mi piacerebbe cercare frasi usando espressioni regolari su siti come Wikipedia e Wikimedia Commons. È possibile farlo?

Esempio di query di ricerca regex: (facebook | google) (storia aziendale | siti Web)

È già possibile fare lo stesso su Google ( come dimostrato qui ), quindi voglio sapere se è possibile anche per Wikipedia.


Saresti disposto a scaricare diversi gigabyte di dati e fare tutti i filtri sul tuo computer?
svick

Sembra che sia possibile farlo utilizzando AutoWikiBrowser: en.wikipedia.org/wiki/Wikipedia:AutoWikiBrowser/…
Anderson Green

Puoi usare AWB per cercare una determinata pagina (o un insieme di pagine), ma non l'intero wiki, che stavo assumendo è quello che volevi.
svick

Sì, volevo cercare in tutto il wiki. Ci sono strumenti sul server degli strumenti per questo?
Anderson Green,

Risposte:


3

È possibile cercare Wikipedia (o qualsiasi altro sito a cui un motore di ricerca può accedere) utilizzando semplici espressioni regolari, purché si faccia affidamento su un motore di ricerca. La seguente query di ricerca di Google cerca su Wikipedia le corrispondenze dell'espressione regolare (Yahoo|Google|Microsoft):

https://www.google.com/#hl=en&sclient=psy-ab&q=site:en.wikipedia.org+(google+OR+yahoo+OR+microsoft)&oq=site:en.wikipedia.org+(google+OR + yahoo + O + Microsoft) & gs_l = hp.3 ... 87411.96861.2.97076.26.24.2.0.0.0.79.1141.24.24.0 ... 0.0 ... 1c.1.7.psy-ab.s2oGD_2LKy4 & PBX = 1 & bav = on .2, or.r_cp.r_qf. & bvm = bv.44158598, d.dmg & fp = dc8abc04c054405e & biw = 1366 & bih = 639



2

È disponibile e alimentato da CirrusSearch (basato su ElasticSearch ) che è il motore di ricerca utilizzato nei siti MediaWiki e la piattaforma Wikimedia.

Alcuni esempi di utilizzo:

Nota: riferimento alla guida completa e fonte - su Wikipedia: Guida: Ricerca # Search_string_syntax .

Per quanto riguarda la tua domanda:

Operatori logici

Il motore di ricerca supporta la logica booleana nelle ricerche. Gli operatori logici includono il carattere "-" (segno meno) per "non logico", le parentesi AND, OR e le parentesi di raggruppamento: (_).

L'OR logico deve essere scritto in maiuscolo; l'operatore AND è assunto per tutti i termini (separati da spazi), ma AND capitale è equivalente.

Altri esempi:

  • Semplice AND, OR: "credit card" OR "payment card", "credit card" AND "payment card"- funzionerà come previsto.
  • Suffisso tilde carattere per la ricerca fuzzy ( "suona come") - Ad esempio, la ricerca di charlie~ parker~rendimenti Charlie Parker, Charles Palmer, Charley Parks(fino a due differenza di carattere, escluso il primo).
  • La ricerca con caratteri jolly - la ricerca face*e- inizia con facee termina con una econ qualsiasi cosa nel mezzo. inserisci qui la descrizione dell'immagine

Lettura extra

Maggiori informazioni sul motore di ricerca e su questa estensione per svelare la loro piena funzionalità e funzionalità.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.