Website-Suche

Die 5 besten Tools zum Suchen und Löschen doppelter Dateien unter Linux


Das Organisieren Ihres Home-Verzeichnisses oder sogar Ihres Systems kann besonders schwierig sein, wenn Sie die Angewohnheit haben, mit Ihren Download-Managern alle möglichen Dinge aus dem Internet herunterzuladen.

Oft stellen Sie möglicherweise fest, dass Sie dieselben MP3-, PDF- und EPUB-Dateien (sowie alle möglichen anderen Dateierweiterungen) heruntergeladen und in verschiedene Verzeichnisse kopiert haben. Dies kann dazu führen, dass Ihre Verzeichnisse mit allen möglichen nutzlosen Duplikaten vollgestopft werden.

In diesem Tutorial erfahren Sie, wie Sie unter Linux mit den Befehlszeilentools rdfind, fdupes und rmlint doppelte Dateien finden und löschen sowie die Verwendung von GUI-Tools namens DupeGuru und FSlint.

Ein Hinweis zur Vorsicht: Seien Sie immer vorsichtig, was Sie auf Ihrem System löschen, da dies zu unerwünschtem Datenverlust führen kann. Wenn Sie ein neues Tool verwenden, probieren Sie es zunächst in einem Testverzeichnis aus, in dem das Löschen von Dateien kein Problem darstellt.

1. Rdfind – Doppelte Dateien unter Linux finden

Rdfind stammt von Redundant Data Find, einem kostenlosen Befehlszeilentool, das zum Auffinden doppelter Dateien in oder innerhalb mehrerer Verzeichnisse verwendet wird. Es durchsucht rekursiv Verzeichnisse und identifiziert Dateien mit identischem Inhalt, sodass Sie entsprechende Maßnahmen wie das Löschen oder Verschieben der Duplikate ergreifen können.

Rdfind verwendet einen Algorithmus zur Klassifizierung der Dateien, erkennt, welches der Duplikate die Originaldatei ist und betrachtet den Rest als Duplikate.

Die Rangordnungsregeln sind:

  • Wenn beim Scannen eines Eingabearguments vor B A gefunden wurde, hat A den höheren Rang.
  • Wenn A in einer tieferen Tiefe als B gefunden wurde, hat A den höheren Rang.
  • Wenn A früher als B gefunden wurde, hat A den höheren Rang.

Die letzte Regel wird insbesondere dann verwendet, wenn zwei Dateien im selben Verzeichnis gefunden werden.

Installieren Sie Rdfind unter Linux

Um rdfind unter Linux zu installieren, verwenden Sie den folgenden Befehl entsprechend Ihrer Linux-Distribution.

sudo apt install rdfind         [On Debian, Ubuntu and Mint]
sudo yum install rdfind         [On RHEL/CentOS/Fedora and Rocky/AlmaLinux]
sudo emerge -a sys-apps/rdfind  [On Gentoo Linux]
sudo apk add rdfind             [On Alpine Linux]
sudo pacman -S rdfind           [On Arch Linux]
sudo zypper install rdfind      [On OpenSUSE]    

Um rdfind in einem Verzeichnis auszuführen, geben Sie einfach rdfind und das Zielverzeichnis ein.

rdfind /home/user

Wie Sie sehen, speichert rdfind die Ergebnisse in einer Datei namens results.txt, die sich im selben Verzeichnis befindet, in dem Sie das Programm ausgeführt haben. Die Datei enthält alle doppelten Dateien, die rdfind gefunden hat. Sie können die Datei überprüfen und die doppelten Dateien bei Bedarf manuell entfernen.

Sie können auch die Option -dryrun verwenden, die eine Liste der Duplikate bereitstellt, ohne dass Sie irgendwelche Aktionen ausführen müssen:

rdfind -dryrun true /home/user

Wenn Sie die Duplikate finden, können Sie sie durch Hardlinks ersetzen.

rdfind -makehardlinks true /home/user

Und wenn Sie die Duplikate löschen möchten, können Sie ausführen.

rdfind -deleteduplicates true /home/user

Um andere nützliche Optionen von rdfind zu überprüfen, können Sie das rdfind-Handbuch verwenden.

man rdfind 

2. Fdupes – Unter Linux nach doppelten Dateien suchen

Fdupes ist ein weiteres Befehlszeilenprogramm, mit dem Sie doppelte Dateien auf Ihrem System identifizieren können. Es durchsucht Verzeichnisse rekursiv und vergleicht Dateigrößen und -inhalte, um Duplikate zu identifizieren.

Es verwendet die folgenden Methoden, um doppelte Dateien zu ermitteln:

  • Vergleich partieller MD5sum-Signaturen
  • Vergleich vollständiger MD5sum-Signaturen
  • Überprüfung des Byte-für-Byte-Vergleichs

Genau wie rdfind hat es ähnliche Optionen:

  • Rekursiv suchen
  • Leere Dateien ausschließen
  • Zeigt die Größe doppelter Dateien an
  • Löschen Sie Duplikate sofort
  • Schließen Sie Dateien mit einem anderen Eigentümer aus

Installieren Sie Fdupes unter Linux

Um fdupes unter Linux zu installieren, verwenden Sie den folgenden Befehl entsprechend Ihrer Linux-Distribution.

sudo apt install fdupes         [On Debian, Ubuntu and Mint]
sudo yum install fdupes         [On RHEL/CentOS/Fedora and Rocky/AlmaLinux]
sudo emerge -a sys-apps/fdupes  [On Gentoo Linux]
sudo apk add fdupes             [On Alpine Linux]
sudo pacman -S fdupes           [On Arch Linux]
sudo zypper install fdupes      [On OpenSUSE]    

Die Syntax von Fdupes ähnelt der von rdfind. Geben Sie einfach den Befehl ein, gefolgt vom Verzeichnis, das Sie scannen möchten.

fdupes <dir>

Um Dateien rekursiv zu durchsuchen, müssen Sie mit -r eine Option wie diese angeben.

fdupes -r <dir>

Sie können auch mehrere Verzeichnisse angeben und ein Verzeichnis angeben, das rekursiv durchsucht werden soll.

fdupes <dir1> -r <dir2>

Damit fdupes die Größe der doppelten Dateien berechnet, verwenden Sie die Option -S.

fdupes -S <dir>

Um zusammengefasste Informationen über die gefundenen Dateien zu sammeln, verwenden Sie die Option -m.

fdupes -m <dir>

Wenn Sie schließlich alle Duplikate löschen möchten, verwenden Sie -d und eine Option wie diese.

fdupes -d <dir>

Fdupes fragt, welche der gefundenen Dateien gelöscht werden sollen. Sie müssen das Aktenzeichen eingeben:

Eine Lösung, die definitiv nicht empfohlen wird, ist die Verwendung der Option -N, die dazu führt, dass nur die erste Datei erhalten bleibt.

fdupes -dN <dir>

Um eine Liste der verfügbaren Optionen zur Verwendung mit fdupes zu erhalten, sehen Sie sich die Hilfeseite an, indem Sie Folgendes ausführen.

fdupes -help

3. Rmlint – Doppelte Dateien entfernen

Rmlint ist ein Befehlszeilentool, das zum Suchen und Entfernen doppelter und lintähnlicher Dateien in Linux-Systemen verwendet wird. Es hilft dabei, Dateien mit identischem Inhalt sowie verschiedene Formen von Redundanz oder Flusen zu identifizieren, wie z. B. leere Dateien, defekte symbolische Links und verwaiste Dateien.

Installieren Sie Rmlint unter Linux

Um Rmlint unter Linux zu installieren, verwenden Sie den folgenden Befehl entsprechend Ihrer Linux-Distribution.

sudo apt install rmlint         [On Debian, Ubuntu and Mint]
sudo yum install rmlint         [On RHEL/CentOS/Fedora and Rocky/AlmaLinux]
sudo emerge -a sys-apps/rmlint  [On Gentoo Linux]
sudo apk add rmlint             [On Alpine Linux]
sudo pacman -S rmlint           [On Arch Linux]
sudo zypper install rmlint      [On OpenSUSE]    

4. dupeGuru – Finden Sie doppelte Dateien unter Linux

dupeGuru ist ein Open-Source- und plattformübergreifendes Tool, das zum Auffinden doppelter Dateien in einem Linux-System verwendet werden kann. Das Tool kann entweder Dateinamen oder Inhalte in einem oder mehreren Ordnern scannen. Außerdem können Sie damit den Dateinamen finden, der den gesuchten Dateien ähnelt.

dupeGuru gibt es in verschiedenen Versionen für Windows-, Mac- und Linux-Plattformen. Die Funktion des schnellen Fuzzy-Matching-Algorithmus hilft Ihnen, doppelte Dateien innerhalb einer Minute zu finden. Es ist anpassbar, Sie können genau die doppelten Dateien abrufen, die Sie möchten, und unerwünschte Dateien aus dem System löschen.

Installieren Sie dupeGuru unter Linux

Um dupeGuru unter Linux zu installieren, verwenden Sie den folgenden Befehl entsprechend Ihrer Linux-Distribution.

sudo apt install dupeguru         [On Debian, Ubuntu and Mint]
sudo yum install dupeguru         [On RHEL/CentOS/Fedora and Rocky/AlmaLinux]
sudo emerge -a sys-apps/dupeguru  [On Gentoo Linux]
sudo apk add dupeguru             [On Alpine Linux]
sudo pacman -S dupeguru           [On Arch Linux]
sudo zypper install dupeguru      [On OpenSUSE]    

5. FSlint – Duplicate File Finder für Linux

FSlint ist ein kostenloses Dienstprogramm, das zum Auffinden und Entfernen verschiedener Formen von Lint in einem Dateisystem verwendet wird. Außerdem werden doppelte Dateien, leere Verzeichnisse, temporäre Dateien, doppelte/widersprüchliche (Binär-)Namen, fehlerhafte symbolische Links und vieles mehr gemeldet. Es verfügt sowohl über einen Befehlszeilen- als auch einen GUI-Modus.

Es ist jedoch wichtig zu beachten, dass FSlint nach meinem Kenntnisstand im September 2022 zuletzt im Jahr 2013 aktualisiert wurde und möglicherweise nicht aktiv gewartet wird oder mit neueren Linux-Distributionen nicht kompatibel ist.

Installieren Sie FSlint unter Linux

Um FSlint unter Linux zu installieren, verwenden Sie den folgenden Befehl entsprechend Ihrer Linux-Distribution.

sudo apt install fslint         [On Debian, Ubuntu and Mint]
sudo yum install fslint         [On RHEL/CentOS/Fedora and Rocky/AlmaLinux]
sudo emerge -a sys-apps/fslint  [On Gentoo Linux]
sudo apk add fslint             [On Alpine Linux]
sudo pacman -S fslint           [On Arch Linux]
sudo zypper install fslint      [On OpenSUSE]    

Abschluss

Dies sind sehr nützliche Tools, um doppelte Dateien auf Ihrem Linux-System zu finden. Sie sollten jedoch beim Löschen solcher Dateien sehr vorsichtig sein.

Wenn Sie nicht sicher sind, ob Sie eine Datei benötigen oder nicht, erstellen Sie am besten eine Sicherungskopie dieser Datei und merken Sie sich ihr Verzeichnis, bevor Sie sie löschen. Wenn Sie Fragen oder Kommentare haben, senden Sie diese bitte im Kommentarbereich unten.