Chercher des fichiers en double
Rechercher des doublons, des fichiers ou répertoires en plusieurs exemplaires.
Quelques applications
- Shredder duplicate finder (rmlint-gui) accessible depuis la logithèque d'Ubuntu ou avec sudo apt install rmlint-gui (Site officiel : Shredder duplicate finder)
- Speedy Duplicate Finder : Logiciel propriétaire, version de démonstration, accessible depuis la logithèque d'Ubuntu ou avec sudo snap install speedy-duplicate-finder
En ligne de commande
Les deux sections sont tirés des réponses provenant du site What's the quickest way to find duplicated files ?
En une ligne
La commande ci-dessous va récupérer les fichiers dans le répertoire courant, et pour chaque fichier, calculer leur somme de hachage. Ensuite les sommes sont triés et seulement les doublons seront affichés (option -d
et -D
de uniq)
find . ! -empty -type f -exec md5sum {} + | sort | uniq -w32 -dD
simple mais non optimisé si vous avez de beaucoup de gros fichier (le hachage peut-être évité si les fichiers n'ont pas la même taille). Si vous êtes dans la situation où vous avez énormément de gros fichier, préférez le script dans la session ci-dessous
Avec un script
Ce script ne réalise le hachage du fichier que si la taille de deux fichiers sont égaux. find-dupes.awk (Github)
Alterner le commentaire dans le script afin d'utiliser md5_exec = "md5sum"
## md5_exec = "md5" md5_exec = "md5sum"