Come scaricare un MediaWiki per l'uso offline?


16

Vorrei essere in grado di realizzare una versione offline di un sito MediaWiki su base settimanale.

L' estensione DumpHTML in realtà fa quello che voglio, in quanto scarica tutti gli articoli e i file multimediali, ma non riesco a vedere alcun indice di tutti gli articoli scaricati, quindi non riesco a navigare nel dump.

Leggendo sulla funzione di dump XML di MediaWiki, mi chiedo se sarebbe possibile utilizzare un programma per visualizzare questi file o forse convertirli in HTML?

Oppure ci sono altri modi per creare una versione offline di un sito MediaWiki?


Hai davvero bisogno di un indice? Basta iniziare Main Pagee seguire i collegamenti da lì.
Ilmari Karonen,

Ecco le istruzioni di Cam Webb per realizzare una versione statica di un sito MediaWiki. Qui sono i miei , nel caso in cui aiutino qualcuno. Entrambi forniscono collegamenti al risultato statico (il mio qui ).
Michael Allan,

Risposte:


8

È possibile utilizzare uno strumento webcrawler che salverà il sito come file HTML. Tutti i collegamenti verranno convertiti, quindi puoi aprire la pagina principale, dire, quindi fare clic sui collegamenti e accedere a tutto il sito.

Sono disponibili numerosi strumenti. Uso wget , che è basato sulla riga di comando e ha migliaia di opzioni, quindi non molto amichevole. Tuttavia è abbastanza potente.

Ad esempio, ecco la riga di comando che ho usato per scaricare il mio sito mediawiki. Ti suggerisco di capire ogni opzione prima di usarla tu stesso:

"c:\program files\wget\wget" -k -p -r -R '*Special*' -R '*Help*' -E http://example.com/wiki

10

Puoi prendere -pages-articles.xml.bz2dal sito di discariche Wikimedia ed elaborarli con WikiTaxi (scarica nell'angolo in alto a sinistra). Lo strumento di importazione di Wikitaxi creerà un file .taxi(circa 15 GB per Wikipedia) dal .bz2file. Quel file verrà utilizzato dal programma WikiTaxi per cercare tra gli articoli. L'esperienza è molto simile all'esperienza del browser.

Oppure puoi usare Kiwix , più veloce da configurare perché fornisce anche i dump ( .zimfile) già elaborati . Come specificato nel commento per poter utilizzare altri siti MediaWiki per kiwix mwoffliner, potrebbe non funzionare con tutti poiché potrebbero avere differenze personalizzate, ma è l'unica variante che ho riscontrato.

Portare cose su Wikimedia wgetnon è una buona pratica. Se troppe persone lo farebbero, potrebbe inondare i siti di richieste.


Successivamente modifica per il caso desideri anche le immagini offline:

Progetto XOWA

Se si desidera un mirror completo di Wikipedia (comprese le immagini) formattazione HTML completa intatta che verrà scaricata in circa 30 ore , è necessario utilizzare:

Wikipedia in inglese ha molti dati. Ci sono 13,9 + milioni di pagine con 20,0+ GB di testo, oltre a 3,7+ milioni di miniature.

XOWA :

L'impostazione di tutto questo sul tuo computer non sarà un processo rapido ... L'importazione stessa richiederà 80 GB di spazio su disco e cinque ore di elaborazione per la versione di testo. Se vuoi anche immagini, i numeri aumentano a 100 GB di spazio su disco e 30 ore di tempo di elaborazione. Tuttavia, quando hai finito, avrai una copia completa e recente di Wikipedia in inglese con immagini che possono stare su una scheda SD da 128 GB.

Ma la versione offline è molto simile alla versione online, include foto ecc: (ho testato l'articolo qui sotto completamente offline) inserisci qui la descrizione dell'immagine


Successivamente modifica se non si applica nessuna delle precedenti:

Se il wiki non fa parte di Wikimedia o non ha un dump, c'è un progetto su github che scarica quel wiki usando la sua API:

WikiTeam - Archiviamo i wiki, da Wikipedia ai wiki più piccoli


1
In caso di dumping di un'installazione mediawiki personalizzata, XOWA è abbastanza in grado di farlo (alcuni problemi potrebbero esistere), in seguito all'articolo xowa.org/home/wiki/App/Wiki_types/Wikia.com è abbastanza utile. L'utilizzo di Kiwix con wiki personalizzati deve ancora essere testato (è necessario scaricare il wiki con github.com/kiwix/mwoffliner o qualche altro strumento prima)
scala mobile
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.