C'è un modo per filtrare le tabelle di Wikipedia?


12

Sto cercando un modo per filtrare le tabelle che si trovano spesso negli articoli di Wikipedia, quindi posso confrontare solo le righe (e le colonne) che mi interessano.

C'è neanche

  1. una funzionalità integrata nel motore di Wikipedia di cui non sono a conoscenza
  2. o un plug-in del browser che supporti questo

Le caratteristiche che mi vengono in mente sono:

  • Filtra per valore di colonna
  • Nascondi colonne
  • Ordinamento multilivello

Ahhh ... il campo minato fuori tema. Vedi il punto 3 nella prima tabella. Sto chiedendo qualcosa di specifico per Wikipedia. In effetti una sceneggiatura di Greasemonkey farebbe, ma non sono riuscito a trovarne una
pesce palla

Risposte:


8

Se inserisci questa formula in una cella all'interno di Google Sheet, eliminerà i dati tabulari da questo link dell'articolo di Wikipedia: http://en.wikipedia.org/wiki/Demographics_of_India

=IMPORTHTML("http://en.wikipedia.org/wiki/Demographics_of_India", "table", 4)

Una volta che hai i dati all'interno di Google Sheet, puoi filtrare per valore di colonna (seleziona intestazione di colonna, scegli Filtro dal menu Dati ) e nascondi colonna (seleziona colonna, scegli Nascondi colonna dal menu di scelta rapida)

Schermata di Fogli Google


1

Tabelle? Intendi le caselle informative? Probabilmente dovresti usare Wikidata http://wikidata.org/w/api.php ed estrarre le informazioni da lì (sarà più pulito), quindi presentarlo come preferisci.

Altrimenti, puoi cospargere display: noneovunque su ID e classi appropriati per le tabelle in questione, ma sarà un inseguimento senza fine di informazioni non strutturate.


1

Lo script Greasemonkey del filtro tabella Wikipedia fa quello che vuoi:

Riepilogo script: filtra le tabelle di Wikipedia rimuovendo tutte le righe con un valore indesiderato o eliminando determinate righe e colonne.

Potrebbe essere necessario aggiungere la httpsversione dell'URL wikiedia all'elenco dei filtri delle pagine incluse nello script per farlo funzionare.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.