Puoi prendere -pages-articles.xml.bz2
dal sito di discariche Wikimedia ed elaborarli con WikiTaxi (scarica nell'angolo in alto a sinistra). Lo strumento di importazione di Wikitaxi creerà un file .taxi
(circa 15 GB per Wikipedia) dal .bz2
file. Quel file verrà utilizzato dal programma WikiTaxi per cercare tra gli articoli. L'esperienza è molto simile all'esperienza del browser.
Oppure puoi usare Kiwix , più veloce da configurare perché fornisce anche i dump ( .zim
file) già elaborati . Come specificato nel commento per poter utilizzare altri siti MediaWiki per kiwix mwoffliner
, potrebbe non funzionare con tutti poiché potrebbero avere differenze personalizzate, ma è l'unica variante che ho riscontrato.
Portare cose su Wikimedia wget
non è una buona pratica. Se troppe persone lo farebbero, potrebbe inondare i siti di richieste.
Successivamente modifica per il caso desideri anche le immagini offline:
Se si desidera un mirror completo di Wikipedia (comprese le immagini) formattazione HTML completa intatta che verrà scaricata in circa 30 ore , è necessario utilizzare:
Wikipedia in inglese ha molti dati. Ci sono 13,9 + milioni di pagine con 20,0+ GB di testo, oltre a 3,7+ milioni di miniature.
XOWA :
L'impostazione di tutto questo sul tuo computer non sarà un processo rapido ... L'importazione stessa richiederà 80 GB di spazio su disco e cinque ore di elaborazione per la versione di testo. Se vuoi anche immagini, i numeri aumentano a 100 GB di spazio su disco e 30 ore di tempo di elaborazione. Tuttavia, quando hai finito, avrai una copia completa e recente di Wikipedia in inglese con immagini che possono stare su una scheda SD da 128 GB.
Ma la versione offline è molto simile alla versione online, include foto ecc:
(ho testato l'articolo qui sotto completamente offline)
Successivamente modifica se non si applica nessuna delle precedenti:
Se il wiki non fa parte di Wikimedia o non ha un dump, c'è un progetto su github che scarica quel wiki usando la sua API:
Main Page
e seguire i collegamenti da lì.