Ecco una sceneggiatura che fa esattamente quello che hai chiesto.
I requisiti
- I file trasferiti devono avere una dimensione inferiore a una soglia.
- I file devono essere modificati rispetto alla destinazione rsync.
- Se non è possibile trasferire tutti i file, è necessario selezionare solo i file modificati più di recente.
I dettagli
Usa rsync --dry-run
per creare un elenco di file che verrebbero trasferiti (questi sono i file modificati). Quindi utilizza una combinazione di du
e ls
per ottenere dimensioni dei file e mtime. Quindi ordina i file in base a mtime e quindi passa su di essi fino a quando la dimensione totale supera una soglia. Infine, chiama di nuovo rsync con solo i file che sono stati modificati più di recente e le dimensioni totali al di sotto della soglia.
La sceneggiatura è un po 'brutta, ma funziona. Una grande limitazione è che deve essere eseguito sulla macchina contenente la directory froms di rsync. Può essere modificato per usare ssh per usare una directory remota da, ma quel excersize è lasciato al lettore.
Infine, le rsync
opzioni sono codificate nello script, ma questa è una modifica facile se si desidera specificarle sulla riga di comando. Inoltre, la matematica per calcolare la dimensione viene eseguita in byte. Questo può essere cambiato in chilo / mega / gigabyte modificando la chiamata in du e riducendo la soglia dello stesso fattore.
uso
./rsyncrecent.sh rsync-from-directory rsync-to-directory
dove rsync-from-directory
è una directory locale ed rsync-to-directory
è qualsiasi directory locale o remota. Le opzioni predefinite sono codificate come -avz
e la soglia predefinita è codificata come 10GiB
.
Il copione
#!/bin/bash
RSYNC=rsync
RSYNC_OPTS=-avz
THRESHOLD=10737418240
usage () {
echo >&2 "Usage: $0 from-location to-location"
exit 1
}
[ "$#" -eq 2 ] || usage
RSYNC_FROM=$1
RSYNC_TO=$2
echo "Fetching file list for $RSYNC $RSYNC_OPTS $RSYNC_FROM $RSYNC_TO"
# get list of changed files
FILES=`$RSYNC $RSYNC_OPTS --dry-run $RSYNC_FROM $RSYNC_TO | sed -n '/list$/,/^$/{/sending.*list$/ d ; /^$/ d ; /\/$/ d ;; p}'`
# reported files are relative to ..RSYNC_FROM, so rather than transforming filenames, lets just move there
pushd $RSYNC_FROM > /dev/null
# get modified time and sizes for all files
i=0
for FILE in $FILES
do
#strip first part of path so files are relative to RSYNC_FROM
FILE=${FILE#*/}
#FSIZE=`ls -l $FILE | cut -f5 -d' '`
FSIZE=`du -bs $FILE`
FMTIME=`ls -l --time-style=+%s $FILE | cut -f6 -d' '`
FLIST[$i]=`echo $FMTIME $FILE $FSIZE`
((i=$i+1))
done
# go back to original directory
popd > /dev/null
# sort list according to modified time
IFS=$'\n' FLIST=($(sort -rg <<<"${FLIST[*]}"))
max=$i
i=0
size=0
#NEWFLIST=''
# add up the files in mtime order until threshold is reached
for ((i=0; i<$max; i++))
do
s=`echo ${FLIST[$i]} | cut -f3 -d' '`
f=`echo ${FLIST[$i]} | cut -f2 -d' '`
((size=$size+$s))
if (( "$size" > "$THRESHOLD" ))
then
break
fi
NEWFLIST="$NEWFLIST $f"
echo $f >> /tmp/rsyncfilelist
done
$RSYNC $RSYNC_OPTS --dry-run $RSYNC_FROM --files-from=/tmp/rsyncfilelist $RSYNC_TO
rm /tmp/rsyncfilelist