Posted on January 23, 2017 by admin

Files duplicati addio

Gli SSD stanno spopolando, ma per ora sono ancora troppo piccoli rispetto ai loro fratelli maggiori HDD.
Uno, se non il più importante problema diventa lo spazio libero disponibile.

Vediamo quale potrebbe essere una strategia da adottare per fare da se la ricerca dei files duplicati.

Per dimensione: files con dimensioni differenti non possono essere identici. Questo processo di comparazione è velocissimo e non necessita neanche dell’apertura del file. Due files hanno dimensioni differenti? Bene, sicuramente non è un duplicato.

Per MD5: il secondo step è quello di confrontare l’MD5/SHA dei files. Anche in questo caso se i files sono diversi avranno due MD5 diversi. Questa operazione ci mette un po’ di più della precedente perché deve leggere tutto il file e calcolare. I confronti multipli sono più veloci.

byte-per-byte: se i due step sopra sono falliti e cioè hanno uguale dimensione e uguale MD5 allora si procede per una comparazione byte per byte, fermandosi alla prima differenza riscontrata.

Se anche la comparazione byte per byte va a termine, allora i due files sono davvero lo stesso file.