Initial vault setup

This commit is contained in:
2026-06-09 18:40:21 +02:00
commit bda02d587f
3692 changed files with 402457 additions and 0 deletions
@@ -0,0 +1,107 @@
---
title: ArchiveBox
created: 2026-06-08
updated: 2026-06-08
type: app
tags: [catalogue, archive, app-marathon-batch-b]
confidence: high
contested: false
sources: [https://selfh.st/apps/?tag=Archive&app=archivebox, https://archivebox.io/]
---
# 📦 ArchiveBox
> **L'archive web open-source de référence** : snapshots HTML, PDF, screenshots, vidéos, WARC, médias sociaux. Tout en local, import depuis bookmarks, RSS, Pocket.
## 📋 Informations Générales
| Champ | Valeur |
| :--- | :--- |
| **Site web** | [archivebox.io](https://archivebox.io/) |
| **GitHub** | [ArchiveBox/ArchiveBox](https://github.com/ArchiveBox/ArchiveBox) |
| **License** | MIT |
| **Langage** | Python |
| **Étoiles GitHub** | 24k ⭐ |
| **Catégorie** | [[cat-archive|Archive]] |
## 📝 Description
**ArchiveBox** est un **"internet archiving"** self-hosted. Il capture des pages web sous plusieurs formats (HTML+ressources, PDF, screenshot PNG, WARC, médias) pour les consulter hors-ligne, les partager, ou résister au link rot. Import depuis Pocket, Pinboard, RSS, bookmarks navigateur, ligne de commande.
Différence vs Wallabag : Wallabag = read-it-later (un seul format lisible). ArchiveBox = **multi-format, fidélité d'archive**, plusieurs méthodes de capture par URL.
Pour qui : journalistes, chercheurs, archivistes, particuliers inquiets de la disparition du contenu web ("digital preservation").
## 🚀 Installation
### Docker Compose
```yaml
version: '3.8'
services:
archivebox:
image: archivebox/archivebox:latest
container_name: archivebox
restart: unless-stopped
command: server --quick-init 0.0.0.0:8000
environment:
- ALLOWED_HOSTS=archive.example.com
- PUBLIC_INDEX=True
- PUBLIC_SNAPSHOTS=True
- MEDIA_MAX_SIZE=750m
volumes:
- archivebox_data:/data
labels:
- "traefik.enable=true"
- "traefik.http.routers.archivebox.rule=Host(`archive.example.com`)"
- "traefik.http.routers.archivebox.entrypoints=websecure"
- "traefik.http.routers.archivebox.tls.certresolver=letsencrypt"
volumes:
archivebox_data:
```
### Utilisation (CLI ou Web)
```bash
# Ajouter une URL
docker exec archivebox archivebox add 'https://example.com'
# Importer des bookmarks Netscape
docker exec archivebox archivebox add < bookmarks.html
# Importer un flux RSS
docker exec archivebox archivebox add --depth=1 'https://example.com/feed.xml'
```
## 🔄 Alternatives
### Open Source
- **Wallabag** — Read-it-later simple
- [[app-project-nomad]] — Archive monorepo
- [[app-ganymede]] — Archive vidéo
- **Shaarli** — Bookmarks personnels
- **Perkeep (Camlistore)** — Personal cloud storage
### Propriétaires
- **Pocket** — Read-it-later Mozilla
- **Pinboard** — Bookmarks payants
- **Internet Archive** — Archive publique (Wayback)
- **Wayback Machine Save** — Extension
## 🔐 Sécurité
- **Auth** : email/password + SSO
- **HTTPS** : obligatoire (URLs archivées souvent sensibles)
- **Permissions fichiers** : dossiers snapshots en lecture seule côté public
- **Pas d'auth par défaut** : activer `ALLOW_SNAPSHOT_LOCAL_ACCESS=False`
- **CSP** : sandbox iframe pour les snapshots
## 📚 Ressources
- [Site officiel](https://archivebox.io/)
- [GitHub](https://github.com/ArchiveBox/ArchiveBox)
- [Documentation](https://github.com/ArchiveBox/ArchiveBox/wiki)
## Pages Liées
- [[cat-archive]] — Catégorie Archive
- [[app-wallabag]] — Concurrent read-it-later
- [[recettes-docker-compose]] — Templates Docker