Ho un sacco di messaggi duplicati nel Maildir del mio server IMAP. Qual è il modo migliore per rimuoverli?
Alcuni punti rilevanti:
- L'ID messaggio condiviso è in genere una definizione sufficientemente buona di duplicato. Un piccolo script che rimuove tutti tranne uno dei messaggi duplicati funzionerebbe.
- A volte è necessario trovare duplicati basati su corpi di messaggi condivisi. Qual è una definizione ragionevole di condivisa qui? Equivalente bit a bit? Che dire delle strane differenze nell'involucro di linea, nella fuga, nella codifica dei caratteri?
- A volte c'è una differenza significativa tra i messaggi "duplicati". Qual è il modo migliore per esaminare le differenze nelle serie di messaggi "duplicati"? Diffs?