diff -r solo per alcuni tipi di file


12

Esiste un modo per eseguire una diff ricorsiva di due directory ma confrontare solo (nelle rispettive posizioni) i file che corrispondono a un determinato nome di file o predicato del tipo di file?

Ad esempio, vorrei fare qualcosa del genere

diff -r dir-a dir-b -filenames *.java, ivy.xml, build.xml

... o ancora meglio:

diff -r dir-a dir-b -filetype text

Chiaramente non è obbligatorio usare diffcome suppongo un incantesimo con finde -exec diffpotrei anche fare il trucco (semplicemente non so come generare i percorsi di file complementari in quest'ultimo caso).


3
C'è un'opzione per escludere i file che corrispondono a un modello, non vedo un'opzione per includere solo i file che corrispondono al modello.
Barmar,

1
Tutte le soluzioni specifiche per il confronto delle directory può essere trovato alla gnu.org/software/diffutils/manual/html_node/...
Barmar

1
vedi questo link e vedi la risposta di Sérgio.
yehudahs,

Risposte:


1

shellscript differ-r

Questo shellscript può eseguire una diff ricorsiva di due directory ma confrontare solo (nelle rispettive posizioni) file che corrispondono a uno specifico nome di file o modello di tipo di file.

#!/bin/bash

greenvid="\0033[32m"
resetvid="\0033[0m"

if [ $# -ne 3 ]
then
 echo "Usage: compare files in two directories including subdirectories"
 echo "         $0 <source-dir> <target-dir> <pattern>"
 echo "Example: $0  subdir-1     subdir-2     \"*.txt\""
 exit
fi

cmd='for pathname do
        greenvid="\0033[32m"
        resetvid="\0033[0m"
        echo -e "${greenvid}diff \"$pathname\" \"${pathname/'\"$1\"'/'\"$2\"'}\"${resetvid}"
        diff "$pathname" "${pathname/'\"$1\"'/'\"$2\"'}"
    done'
#echo "$cmd"

find "$1" -type f -name "$3" -exec bash -c "$cmd" bash {} +

dimostrazione

File:

$ find -type f
./1/ett.txt
./1/two.doc
./1/t r e.txt
./1/sub/only-one.doc
./1/sub/hello.doc
./1/sub/hejsan.doc
./differ-r2
./differ-r1
./differ-r
./2/ett.txt
./2/two.doc
./2/t r e.txt
./2/sub/hello.doc
./2/sub/hejsan.doc

Uso:

$ ./differ-r
Usage: compare files in two directories including subdirectories
         ./differ-r <source-dir> <target-dir> <pattern>
Example: ./differ-r  subdir-1     subdir-2     "*.txt"

In esecuzione differ-r:

Le diffrighe di comando eseguite vengono stampate con il testo verde e l'output, quando non vi è alcuna corrispondenza, viene stampato con il testo predefinito (bianco su nero nella schermata seguente).

inserisci qui la descrizione dell'immagine

$ ./differ-r 1 2 "*.doc"
diff "1/two.doc" "2/two.doc"
diff "1/sub/only-one.doc" "2/sub/only-one.doc"
diff: 2/sub/only-one.doc: No such file or directory
diff "1/sub/hello.doc" "2/sub/hello.doc"
2d1
< world
diff "1/sub/hejsan.doc" "2/sub/hejsan.doc"

$ ./differ-r 1 2 "*.txt"
diff "1/ett.txt" "2/ett.txt"
2c2
< stabben
---
> farsan
diff "1/t r e.txt" "2/t r e.txt"
1c1
< t r e
---
> 3
$ 

$ ./differ-r 1 2 "*"
diff "1/ett.txt" "2/ett.txt"
2c2
< stabben
---
> farsan
diff "1/two.doc" "2/two.doc"
diff "1/t r e.txt" "2/t r e.txt"
1c1
< t r e
---
> 3
diff "1/sub/only-one.doc" "2/sub/only-one.doc"
diff: 2/sub/only-one.doc: No such file or directory
diff "1/sub/hello.doc" "2/sub/hello.doc"
2d1
< world
diff "1/sub/hejsan.doc" "2/sub/hejsan.doc"

$ ./differ-r 2 1 "*"
diff "2/ett.txt" "1/ett.txt"
2c2
< farsan
---
> stabben
diff "2/two.doc" "1/two.doc"
diff "2/t r e.txt" "1/t r e.txt"
1c1
< 3
---
> t r e
diff "2/sub/hello.doc" "1/sub/hello.doc"
1a2
> world
diff "2/sub/hejsan.doc" "1/sub/hejsan.doc"

rsync con filtro

Se non è necessario ottenere alcun output che descriva la differenza, sapere solo quali file sono diversi o mancanti (in modo che rsyncsi desideri copiarli), è possibile utilizzare la seguente riga di comando.

rsync --filter="+ <pattern>" --filter="+ */" --filter="- *"--filter="- */"  -avcn <source directory>/ <target directory>

dimostrazione

$ rsync --filter="+ *.doc" --filter="+ */" --filter="- *"  -avcn 1/ 2
sending incremental file list
./
sub/
sub/hello.doc
sub/only-one.doc

sent 276 bytes  received 35 bytes  622.00 bytes/sec
total size is 40  speedup is 0.13 (DRY RUN)

sent 360 bytes  received 41 bytes  802.00 bytes/sec
total size is 61  speedup is 0.15 (DRY RUN)
olle@bionic64 /media/multimed-2/test/test0/temp $ rsync --filter="+ *.txt" --filter="+ */" --filter="- *" -avcn 1/ 2
sending incremental file list
./
ett.txt
t r e.txt
sub/

sent 184 bytes  received 29 bytes  426.00 bytes/sec
total size is 21  speedup is 0.10 (DRY RUN)

Se desideri un output pulito senza commentare le righe e senza directory, puoi farlo in grepquesto modo,

$ pattern="*.doc"; rsync --filter="+ $pattern" --filter="+ */" --filter="- *"  -avcn 1/ 2 | grep "${pattern/\*/.\*}"
sub/hello.doc
sub/only-one.doc

shellscript rsync-diff

Questo one-liner può essere trasformato nel comando principale di uno shellscript rsync-diff.

#!/bin/bash

LANG=C

if [ $# -ne 3 ]
then
 echo "Usage: compare files in two directories including subdirectories"
 echo "         $0 <source-dir> <target-dir> <pattern>"
 echo "Example: $0  subdir-1     subdir-2     \"*.txt\""
 exit
fi

pattern="$3"; rsync --filter="+ $pattern" --filter="+ */" --filter="- *" \
 -avcn "$1"/ "$2" | grep "${pattern//\*/.\*}" | grep -v \
  -e '/$' \
  -e '^sending incremental file list$' \
  -e '^sent.*received.*sec$' \
  -e '^total size is.*speedup.*(DRY RUN)$'

0

Dato che hai citato "Chiaramente non è obbligatorio usare diff",

Questo dovrebbe fare il lavoro per voi fondete facilmente configurabile per quale tipo di tipi di file da ignorare:

inserisci qui la descrizione dell'immagine

inoltre un'altra alternativa sarebbe quella di scrivere un semplice script che passerà da una lista bianca a una lista nera e successivamente la lista nera verrà passata al diff con l' --excludeopzione.


tag aggiornati per aggiungere 'riga di comando'
Marcus Junius Brutus

0

Con la shell che supporta la sostituzione dei comandi puoi usare il seguente one-liner (come già notato da @JammingThebBits):

diff -r dir-a dir-b --exclude-from=<( \
find dir-a dir-b -type f -not \( -name '*.xml'  -or -name '*.java' \) \
| sed 's:^.*/\([^/]*\)$:\1:' \
)

Funziona così: findcerca i file non di interesse, sedestrai il nome di base (l'esecuzione basenameè estremamente lenta se hai molti file) e li inserisce in un file temporaneo ; tale file viene quindi passato per diffdirgli di escluderli dal confronto (doppia esclusione = inclusione).

Se non si dispone della sostituzione dei comandi, inserire l' sedoutput in un file e passarlo esplicitamente a diff.

Nell'esempio ho cercato solo file XML e JAVA, modificandoli secondo necessità separandoli con OR.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.