Come possiamo copiare il testo da Wikipedia senza le parti di citazione "[1]", "[2]", "[3]"?


10

Se copiamo il testo da una pagina di Wikipedia , questo è all'incirca ciò che otteniamo:

La spaziatura delle frasi è lo spazio orizzontale tra le frasi nel testo composto. È una questione di convenzione tipografica. [1] Dall'introduzione della stampa a caratteri mobili in Europa, sono state usate varie convenzioni sulla spaziatura delle frasi nelle lingue con un alfabeto di derivazione latina. [2] Questi includono uno spazio di parole normale (come tra le parole in una frase), un singolo spazio ingrandito, due spazi completi e, più recentemente nei media digitali, nessuno spazio. [3] Sebbene i moderni caratteri digitali possano regolare automaticamente uno spazio di una sola parola per creare una spaziatura visivamente piacevole e coerente dopo la punteggiatura terminale, [4] la maggior parte dei dibattiti riguarda se colpire la barra spaziatrice di una tastiera una o due volte tra le frasi. [5]

Non voglio copiare le parti [1]ed [2]ecc Questo è in realtà quello che volevo copiare:

La spaziatura delle frasi è lo spazio orizzontale tra le frasi nel testo composto. È una questione di convenzione tipografica. Dall'introduzione della stampa a caratteri mobili in Europa, sono state usate varie convenzioni sulla spaziatura delle frasi nelle lingue con un alfabeto di derivazione latina. Questi includono uno spazio di parole normale (come tra le parole in una frase), un singolo spazio ingrandito, due spazi completi e, più recentemente nei media digitali, nessuno spazio. Sebbene i moderni caratteri digitali possano regolare automaticamente uno spazio di una sola parola per creare una spaziatura visivamente piacevole e coerente dopo la punteggiatura terminale, la maggior parte dei dibattiti riguarda se colpire la barra spaziatrice di una tastiera una o due volte tra le frasi.

La risposta selezionata di seguito utilizza regex ma non funziona ogni volta . (Se il testo stesso contiene [e ]il regex non dovrebbe rimuoverli.)

Ci sono soluzioni migliori?


Questi sono riferimenti che probabilmente sono importanti perché spesso supportano la credibilità delle informazioni presentate. Includere riferimenti è utile, in particolare per i ricercatori.
Randolf Richardson,

@Randolf Includere riferimenti può essere utile, specialmente per i ricercatori. non per gli esseri normali che vogliono solo l'informazione
Pacerier,

La funzione di ricerca e sostituzione del tuo elaboratore di testi, eventualmente chiamata da una macro, potrebbe tornare utile qui.
Keith il

Ho comunque votato la tua domanda, perché penso che sia una buona domanda. Per quanto riguarda i riferimenti, molte persone si aspettano di vederli, in particolare i professori all'università (se hai intenzione di frequentarne uno, quasi sicuramente scoprirai che la maggior parte dei professori si aspetta che i riferimenti siano inclusi in tutti gli articoli di ricerca che scrivi, e probabilmente sentire gli altri studenti parlare di riferimenti di volta in volta).
Randolf Richardson,

@Randolf intendo che voglio solo conservare le informazioni per la lettura e l'uso futuri personali.
Pacerier,

Risposte:


10

Un bookmarklet è tuo amico ...

Crea un nuovo segnalibro del browser e copia il codice javascript sottostante: quando vuoi copiare del testo da Wikipedia, fai semplicemente clic su di esso in precedenza e rimuoverà tutte le istanze di [n] per soddisfare le tue esigenze nella domanda.

javascript:function a (){document.body.innerHTML=document.body.innerHTML.replace(/<sup\b[^>]*>(.*?)<\/sup>/gi, "" );return;}; a();

Dietro le quinte, è solo una ricerca di espressioni regolari e la sostituzione di tutti <sup>...</sup>i tag HTML sulla pagina.

Ho appena provato questo in IE7 e funziona bene, quindi spero che dovrebbe essere ok anche in altri browser.

Riconoscerò questo thread SO indicandomi nella giusta direzione: sapevo che un bookmarklet era la strada da percorrere, ma non ne avevo mai scritto uno prima.


1
+1, questo è l'unico modo in cui posso pensare di farlo. Anche altre estensioni del browser dovrebbero usare una sorta di analisi Javascript per fare questo (e in effetti la maggior parte lo fa).
Sfondamento
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.