Posso usare Notepad ++ per selezionare univocamente due file di testo?


2

Ho due liste di parole, una per riga, ciascuna lista in un file separato e ho bisogno di fare due cose:

  1. Unisci i due elenchi ma escludendo i duplicati.
  2. Rimuovi tutte le parole, lunghe meno di 5 caratteri.

Ad esempio: Primo elenco:

apple
banana
orange

Secondo elenco:

apricot
avocado
lime

Lista unita:

apple
banana
orange
apricot
avocado

Come fare questo compito con Notepad ++?


Se possibile, questo sarà estremamente difficile da ottenere con Notepad ++. C'è qualche ragione per cui non puoi usare qualcosa di più sofisticato?
Dennis

Risposte:


5

Fusione:

Il modo più semplice per unire due file è copiare e incollare. Notepad ++ non ha una funzione di fusione dei file incorporati.

Tuttavia, è possibile installare un plug-in per questo. Vedere Combinazione di file in Notepad ++ .

Un'altra soluzione sarebbe la riga di comando copy. Vedere È necessario combinare molti file in una directory

Sostituzione delle interruzioni di riga:

Rimuovere i duplicati sarà più complicato che rimuovere parole brevi da quando la ricerca di Notepad ++ non esegue la ricerca su più righe contemporaneamente, quindi dovremo convertire le interruzioni di riga in qualcos'altro.

Per ottenere ciò, puoi eseguire una sostituzione estesa, trovando tutto \r\n (Interruzione di riga DOS) e sostituendoli con # (o qualsiasi altro carattere che non appare nella tua lista).

Se l'ultima riga non era vuota, aggiungere a # alla fine della stringa risultante.

Rimozione di duplicati:

Ora esegui un'espressione regolare, sostituisci, trova tutto ([^#]+)#(.*#)\1# e sostituendoli con \1#\2.

Se ci fossero duplicati in un singolo file, potrebbe essere necessario farlo più di una volta.

Rimozione di parole di 4 o meno caratteri:

Questo è facile. Basta sostituire un'espressione regolare, trovando tutto #.?.?.?.?# e sostituendoli con #.

Interruzioni di riga:

Ora puoi sbarazzarti della modifica della linea. Basta eseguire una sostituzione estesa, trovando tutto # e sostituendoli con \r\n.

Infine, elimina l'ultima riga in quanto sarà vuota.


Clunky divertente ed efficace.
soandos
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.