3.4 KiB
3.4 KiB
title: ArchiveBox created: 2026-06-08 updated: 2026-06-08 type: app tags: [catalogue, archive, app-marathon-batch-b] confidence: high contested: false sources: [https://selfh.st/apps/?tag=Archive&app=archivebox, https://archivebox.io/]
📦 ArchiveBox
L'archive web open-source de référence : snapshots HTML, PDF, screenshots, vidéos, WARC, médias sociaux. Tout en local, import depuis bookmarks, RSS, Pocket.
📋 Informations Générales
| Champ | Valeur |
|---|---|
| Site web | archivebox.io |
| GitHub | ArchiveBox/ArchiveBox |
| License | MIT |
| Langage | Python |
| Étoiles GitHub | 24k ⭐ |
| Catégorie | [[cat-archive |
📝 Description
ArchiveBox est un "internet archiving" self-hosted. Il capture des pages web sous plusieurs formats (HTML+ressources, PDF, screenshot PNG, WARC, médias) pour les consulter hors-ligne, les partager, ou résister au link rot. Import depuis Pocket, Pinboard, RSS, bookmarks navigateur, ligne de commande.
Différence vs Wallabag : Wallabag = read-it-later (un seul format lisible). ArchiveBox = multi-format, fidélité d'archive, plusieurs méthodes de capture par URL.
Pour qui : journalistes, chercheurs, archivistes, particuliers inquiets de la disparition du contenu web ("digital preservation").
🚀 Installation
Docker Compose
version: '3.8'
services:
archivebox:
image: archivebox/archivebox:latest
container_name: archivebox
restart: unless-stopped
command: server --quick-init 0.0.0.0:8000
environment:
- ALLOWED_HOSTS=archive.example.com
- PUBLIC_INDEX=True
- PUBLIC_SNAPSHOTS=True
- MEDIA_MAX_SIZE=750m
volumes:
- archivebox_data:/data
labels:
- "traefik.enable=true"
- "traefik.http.routers.archivebox.rule=Host(`archive.example.com`)"
- "traefik.http.routers.archivebox.entrypoints=websecure"
- "traefik.http.routers.archivebox.tls.certresolver=letsencrypt"
volumes:
archivebox_data:
Utilisation (CLI ou Web)
# Ajouter une URL
docker exec archivebox archivebox add 'https://example.com'
# Importer des bookmarks Netscape
docker exec archivebox archivebox add < bookmarks.html
# Importer un flux RSS
docker exec archivebox archivebox add --depth=1 'https://example.com/feed.xml'
🔄 Alternatives
Open Source
- Wallabag — Read-it-later simple
- app-project-nomad — Archive monorepo
- app-ganymede — Archive vidéo
- Shaarli — Bookmarks personnels
- Perkeep (Camlistore) — Personal cloud storage
Propriétaires
- Pocket — Read-it-later Mozilla
- Pinboard — Bookmarks payants
- Internet Archive — Archive publique (Wayback)
- Wayback Machine Save — Extension
🔐 Sécurité
- Auth : email/password + SSO
- HTTPS : obligatoire (URLs archivées souvent sensibles)
- Permissions fichiers : dossiers snapshots en lecture seule côté public
- Pas d'auth par défaut : activer
ALLOW_SNAPSHOT_LOCAL_ACCESS=False - CSP : sandbox iframe pour les snapshots
📚 Ressources
Pages Liées
- cat-archive — Catégorie Archive
- app-wallabag — Concurrent read-it-later
- recettes-docker-compose — Templates Docker