Ho appena preso un backup di un database di SQL Server. I file MDF e LDF insieme ammontano a circa 29 GB, ma il file .bak era solo di 23 GB, circa il 20% più piccolo.
La mia prima ipotesi quando una versione di un set di dati è più piccola di un'altra versione contenente gli stessi dati sarebbe la compressione dei dati, ma la compressione di solito produce un rapporto di compressione molto migliore del 20%, specialmente per i dati altamente ordinati (come le tabelle del database. ) Inoltre, i dati compressi non possono essere facilmente compressi ulteriormente, ma so che i file .bak possono essere compressi.
Quindi, se i dati non vengono compressi e non viene scartato nulla (perché l'intero punto di fare un backup è essere in grado di ripristinarli in uno stato identico in seguito), allora che cos'è quel 20% che non viene considerato?