Gli elementi ripetibili sono memorizzati in un dizionario e un codice viene assegnato come sostituto.
QUESTA È UNA SEMPLIFICAZIONE SOPRA
aaaaaaaaaaaaaaaaaaaaaaaa 0001
bbbbbbbbbbbbbbbbbbbbbbbb 0002
alsdjl;asjdfkl;asdfjkljj 0003
invece dell'intera riga ha semplicemente messo il codice al suo posto. Più grande è il dizionario, più codici è in grado di gestire. Normalmente, quando un dizionario si riempie, ne inizia uno nuovo al volo. Quando ne inizia uno nuovo è vuoto e vengono assegnati nuovi codici ai pattern rilevati.
In generale, più grande è, meglio è, fino a un certo punto. L'intero dizionario viene tenuto in memoria, pertanto è necessaria una quantità di RAM maggiore rispetto alle dimensioni del dizionario.
Le dimensioni del dizionario dipendono dalla compressibilità dei dati, dal numero di file, dalle dimensioni e dalle dimensioni complessive.
Generalmente, 32mb è più che sufficiente, ma se si comprimono numerosi file multi-concerto, è possibile utilizzare un numero molto più elevato. I dizionari più grandi spesso rallentano il processo, ma i risultati in un file più piccolo.