Chercher des fichiers en double

Rechercher des doublons, des fichiers ou répertoires en plusieurs exemplaires.

Les deux sections sont tirés des réponses provenant du site What's the quickest way to find duplicated files ?

En une ligne

La commande ci-dessous va récupérer les fichiers dans le répertoire courant, et pour chaque fichier, calculer leur somme de hachage. Ensuite les sommes sont triés et seulement les doublons seront affichés (option -d et -D de uniq)

find . ! -empty -type f -exec md5sum {} + | sort | uniq -w32 -dD
simple mais non optimisé si vous avez de beaucoup de gros fichier (le hachage peut-être évité si les fichiers n'ont pas la même taille). Si vous êtes dans la situation où vous avez énormément de gros fichier, préférez le script dans la session ci-dessous

Avec un script

Ce script ne réalise le hachage du fichier que si la taille de deux fichiers sont égaux. find-dupes.awk (Github)

Alterner le commentaire dans le script afin d'utiliser md5_exec = "md5sum"

## md5_exec = "md5"
md5_exec = "md5sum"
  • doublons.txt
  • Dernière modification: Le 07/10/2024, 21:15
  • par 154.45.213.108