--- title: Czkawka created: 2026-06-07 updated: 2026-06-07 type: app tags: [catalogue, automation, deduplication, file-management, rust, desktop, cli] confidence: high contested: false sources: [https://selfh.st/apps/?tag=Automation, https://github.com/qarmin/czkawka] --- # đŸ§č Czkawka > **Le dĂ©tecteur de doublons ultrarapide Ă©crit en Rust** — libĂ©rez des gigaoctets de votre NAS en quelques minutes en trouvant fichiers identiques, photos similaires, audios dupliquĂ©s, dossiers vides et bien plus. 10x plus rapide que les alternatives historiques. ## 📋 Informations GĂ©nĂ©rales | Champ | Valeur | | :--- | :--- | | **Site web** | [github.com/qarmin/czkawka](https://github.com/qarmin/czkawka) | | **GitHub** | [qarmin/czkawka](https://github.com/qarmin/czkawka) | | **License** | MIT | | **Langage** | Rust (cƓur) + GTK4 (GUI) / CLI | | **Étoiles GitHub** | 1 067 ⭐ (cette stat) / 26k+ en rĂ©alitĂ© | | **DerniĂšre MAJ** | 2026-06-02 | | **CatĂ©gorie** | [[cat-automation\|Automation]] | ## 📝 Description **Czkawka** (prononcer *tchakafka*, Ă  la polonaise : le mot signifie « hoquet » en argot, comme le hoquet de votre disque qui a besoin de place) est l'**outil de nettoyage de fichiers le plus moderne** de l'Ă©cosystĂšme open source. Écrit en **Rust** pour exploiter le parallĂ©lisme massif des processeurs modernes, il scanne des millions de fichiers en quelques minutes lĂ  oĂč les anciens outils mettaient des heures. Le projet est nĂ© d'une frustration : **FSlint** et **dupeGuru** (les classiques) sont restĂ©s bloquĂ©s Ă  Python 2 et GTK 2 pendant des annĂ©es. Czkawka les a remplacĂ©s en offrant **les mĂȘmes fonctionnalitĂ©s en beaucoup plus rapide, avec une UI GTK4 moderne** (Adwaita) et une **CLI** complĂšte pour automatisation serveur. La version GUI est multi-plateforme (Linux, macOS, Windows), la version **CLI tourne headless** sur n'importe quel serveur (idĂ©al pour un NAS). **FonctionnalitĂ©s principales** : - ✅ **Fichiers en double** : dĂ©tection par hash (Blake3, xxHash) — beaucoup plus rapide que MD5 - ✅ **Photos similaires** : similaritĂ© visuelle via hachage perceptuel (permet de trouver des photos recadrĂ©es/redimensionnĂ©es) - ✅ **Dossiers en double** : dĂ©tection par arborescence + contenu - ✅ **Fichiers temporaires** : cache navigateur, logs anciens, thumbnails - ✅ **Vides dossiers / fichiers vides** - ✅ **Fichiers volumineux** : top N par taille - ✅ **Fichiers invalides** : images, vidĂ©os, audios corrompus - ✅ **Extensions identiques** : dĂ©tecter `.jpeg` et `.jpg` du mĂȘme fichier - ✅ **Noms similaires** : "IMG_001.jpg" vs "IMG_001 (1).jpg" - ✅ **Symlinks cassĂ©s** - ✅ **Multi-thread agressif** : utilise tous les cƓurs CPU - ✅ **CLI** complĂšte pour scripting et cron - ✅ **Cache** : scans incrĂ©mentaux, le second scan est instantanĂ© - ⚠ **Aucune modification automatique** : Czkawka liste, l'humain dĂ©cide (sĂ©curitĂ©) **Performance typique** : sur un NAS avec 1 million de fichiers (1 To), un scan doublons prend **5-15 minutes** avec 8 threads. dupeGuru mettrait 2-3 heures. fdupes ~1 heure. ## 🚀 Installation ### Option 1 : Docker (CLI headless, idĂ©al NAS/script) ```yaml # docker-compose.yml services: czkawka-cli: image: docker.io/jlesage/czkawka-cli:latest container_name: czkawka restart: "no" volumes: - /mnt/nas:/data:ro # rĂ©pertoire Ă  scanner - czkawka-cache:/cache # cache des hashes - czkawka-reports:/reports # rapports gĂ©nĂ©rĂ©s command: > czkawka_cli dup --directories /data --hash-type blake3 --size-unit binary --json-results /reports/dup-report.json ``` Lancement manuel : `docker compose run --rm czkawka-cli` puis choisir la sous-commande. ### Option 2 : Binaire Linux natif ```bash # Via cargo (depuis les sources) cargo install czkawka_cli # Ou binaire prĂ©-compilĂ© wget https://github.com/qarmin/czkawka/releases/latest/download/czkawka_cli_linux_amd64.tar.gz tar -xzf czkawka_cli_linux_amd64.tar.gz sudo mv czkawka_cli /usr/local/bin/ # Scan doublons sur /mnt/nas/photos czkawka_cli dup --directories /mnt/nas/photos --hash-type blake3 ``` ### Option 3 : Paquets distro ```bash # Ubuntu/Debian (souvent disponible) sudo apt install czkawka # Arch sudo pacman -S czkawka # Fedora sudo dnf install czkawka ``` ### Option 4 : GUI (Linux/macOS/Windows) - **Flatpak** : `flatpak install flathub com.github.qarmin.czkawka` - **Snap** : `sudo snap install czkawka` - **Windows** : `.exe` disponible sur la page Releases ## ⚙ Configuration - **`--hash-type`** : choisir `blake3` (rapide, sĂ©curisĂ©) ou `xxh3` (le plus rapide) - **`--thread-number N`** : par dĂ©faut = nb de cƓurs, Ă  rĂ©duire sur un NAS en production - **`--minimal-file-size 1MB`** : ignorer les fichiers < taille donnĂ©e - **`--allowed-extensions`** : filtrer par extension (`jpg,png,mp4`) - **`--json-results`** / `--delete-method`** : choisir entre rien (safe), **corbeille**, ou **suppression dĂ©finitive** (Ă  Ă©viter) - **Cache** : `~/.local/share/czkawka/` — **sauvegarder** pour Ă©viter de re-scanner aprĂšs reboot ## 🔗 Alternatives ### Open Source - **fdupes** — le classique Unix, CLI only, plus lent (Python+hash MD5) - **jdupes** — fork de fdupes, plus rapide, en C - **dupeGuru** — la rĂ©fĂ©rence historique, multi-OS, GUI, mais Python 2 + Qt - **FSlint** — encore plus vieux, GTK 2, quasi-abandonnĂ© - **rdfind** — CLI, gĂšre les symlinks, UNIX pur - **rmlint** — rapide, en C, format de sortie riche - **BleachBit** — plus orientĂ© "cache systĂšme" que "doublons" - **SnapRAID/Btrfs/ZFS dedup** — dĂ©dup au niveau filesystem (online) ### PropriĂ©taires (ce que Czkawka remplace) - **Easy Duplicate Finder** — 40 $, Windows only - **Duplicate Cleaner Pro** — 30 $, Windows - **Disk Savvy** — 80 $, Windows server - **Cloud-apps intĂ©grĂ©es** : Google Photos "similar", Apple Photos "duplicates", Dropbox "file requests" (limitĂ©s) - **Total Commander / Beyond Compare** — plugins payants de dĂ©dup ## 🔒 SĂ©curitĂ© - ⚠ **Ne JAMAIS lancer avec `--delete-method delete` sur un premier scan** : vous pourriez perdre des fichiers importants - ✅ Toujours commencer par `--delete-method none` pour **prĂ©visualiser** le rapport - Le mode **corbeille** (`--delete-method trash`) est le plus sĂ»r - **Sauvegarder** les fichiers avant de lancer une opĂ©ration massive (`rsync` ou `borg backup`) - **Permissions** : Czkawka n'a besoin que de **lecture** sur les dossiers scannĂ©s — ne jamais l'exĂ©cuter en root sur un serveur en prod - **Logs** : garder les rapports JSON pour audit (qui a supprimĂ© quoi) - **Photos similaires** : attention, l'algorithme peut signaler des photos diffĂ©rentes mais visuellement proches (chevaux, paysages) — toujours vĂ©rifier manuellement ## 📚 Ressources - [DĂ©pĂŽt GitHub](https://github.com/qarmin/czkawka) - [Wiki officielle](https://github.com/qarmin/czkawka/wiki) - [Comparatif de performances](https://github.com/qarmin/czkawka#performance) - [Docker Hub](https://hub.docker.com/r/jlesage/czkawka-cli) - [Article korben.info (FR)](https://korben.info/czkawka-trouver-fichiers-doubles.html) - [Reddit r/selfhosted](https://www.reddit.com/r/selfhosted/comments/1h7yrdn/czkawka_is_a_must_have_for_any_nas/) ## 🔗 Pages LiĂ©es - [[cat-automation]] — CatĂ©gorie Automation - [[cat-backups]] — CatĂ©gorie Backups (avant tout nettoyage, sauvegarder !) - [[recettes-docker-compose]] — Templates Docker - [[securisation-home-lab]] — SĂ©curitĂ© - [[Catalogue-Self-Hosted]] — Hub