Ho una grande quantità di dati (11G) in un repository di subversion che sto usando rsync per migrare ad Alfresco, che lucene indicizza i nuovi file mentre colpiscono il file system. Sto usando un dav mount come proxy per permettermi di rsync.
Il problema che sto riscontrando è l'indicizzazione post-rsync è un'operazione piuttosto costosa per una grande quantità di dati, quindi mi chiedevo se c'era un modo per separare logicamente il rsync in batch di dimensioni identiche (diciamo 500 MB ciascuno) quindi Potrei programmarli in cron.
Al momento, sto attraversando le cartelle di primo livello e prendendo per prime le più piccole, ma una volta che ho finito con quelle, le sottodirectory molto più grandi saranno piuttosto fastidiose.
Per favore fatemi sapere se avete bisogno di ulteriori informazioni.
Grazie in anticipo.