Scrivi un programma di compressione per i file gzip


11

Il compito di questa sfida è il seguente:

Scrivi un programma che legge un file di dimensioni ragionevoli (diciamo <16 MB) da stdin o altrove (come preferisci, ma non deve essere codificato) e metti l'output compresso su stdout. L'output deve essere un file compresso gzip valido e se il file compresso passa attraverso gunzip, dovrebbe produrre esattamente lo stesso file di prima.

Regole

  • Il linguaggio di programmazione utilizzato deve essere noto prima dell'inizio di questa competizione
  • Il punteggio del tuo programma è il numero di caratteri del codice sorgente o del programma assemblato (qualunque cosa sia più breve)
  • Non è consentito utilizzare alcun tipo di librerie di compressione esistenti.
  • Divertiti!

2
È consentito l'uso di librerie integrate?
hallvabo,

@hallvabo: No. Dimenticato questo. Thx
FUZxxl,

2
Probabilmente il modo migliore per farlo è solo riempire l'ingresso con i marcatori "il seguente blocco non è compresso" all'inizio di ogni blocco.
Anon.

gzip è un linguaggio di programmazione. Non un Turing completo però.
Alexandru,

1
Questo è praticamente identico al problema Guns and Zips . Perché qualcuno pubblichi qui le proprie risposte anziché su codegolf.com è al di là di me, a meno che non voglia risolverlo in una lingua non supportata da codegolf.com (ad es. GolfScript).
Chris Jester-Young,

Risposte:


10

C # (534 caratteri)

using System.IO;using B=System.Byte;class X{static void Main(string[]a){var f=File.ReadAllBytes(a[0]);int l=f.Length,i=0,j;var p=new uint[256];for(uint k=0,r=0;k<256;r=++k){for(j=0;j<8;j++)r=r>>1^(r&1)*0xedb88320;p[k]=r;}uint c=~(uint)0,n=c;using(var o=File.Open(a[0]+".gz",FileMode.Create)){o.Write(new B[]{31,139,8,0,0,0,0,0,4,11},0,10);for(;i<l;i++){o.Write(new B[]{(B)(i<l-1?0:1),1,0,254,255,f[i]},0,6);c=p[(c^f[i])&0xFF]^c>>8;}c^=n;o.Write(new[]{(B)c,(B)(c>>8),(B)(c>>16),(B)(c>>24),(B)l,(B)(l>>8),(B)(l>>16),(B)(l>>24)},0,8);}}}

Molto più leggibile:

using System.IO;
using B = System.Byte;
class X
{
    static void Main(string[] a)
    {
        // Read file contents
        var f = File.ReadAllBytes(a[0]);
        int l = f.Length, i = 0, j;

        // Initialise table for CRC hashsum
        var p = new uint[256];
        for (uint k = 0, r = 0; k < 256; r = ++k)
        {
            for (j = 0; j < 8; j++)
                r = r >> 1 ^ (r & 1) * 0xedb88320;
            p[k] = r;
        }

        uint c = ~(uint) 0, n = c;

        // Write the output file
        using (var o = File.Open(a[0] + ".gz", FileMode.Create))
        {
            // gzip header
            o.Write(new B[] { 31, 139, 8, 0, 0, 0, 0, 0, 4, 11 }, 0, 10);
            for (; i < l; i++)
            {
                // deflate block header plus one byte of payload
                o.Write(new B[] { (B) (i < l - 1 ? 0 : 1), 1, 0, 254, 255, f[i] }, 0, 6);
                // Compute CRC checksum
                c = p[(c ^ f[i]) & 0xFF] ^ c >> 8;
            }
            c ^= n;
            o.Write(new[] {
                // CRC checksum
                (B) c, (B) (c >> 8), (B) (c >> 16), (B) (c >> 24),
                // original file size
                (B) l, (B) (l >> 8), (B) (l >> 16), (B) (l >> 24)
            }, 0, 8);
        }
    }
}

Commenti:

  • Si aspetta il percorso del file come primo argomento della riga di comando.

  • Il file di output è il file di input + .gz.

  • Non sto usando alcuna libreria per fare gzip, deflate o CRC32. È tutto lì dentro.

  • Questo "compressore" aumenta la dimensione del file di un fattore 6. Ma è in formato gzip valido!

  • Testato usando GNU gunzip e WinRAR.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.