--- title: "I, Librarian" created: 2026-06-07 updated: 2026-06-07 type: app tags: [catalogue, document-management, pdf, bibliotheque, php, recherche, scientifique] confidence: high contested: false sources: [https://selfh.st/apps/?tag=document-management, https://github.com/mrzv/librarian, https://www.i-librarian.net/] --- # I, Librarian 📚 > **Gestionnaire de bibliothĂšque PDF** pour chercheurs/acadĂ©miques : indexation full-text, annotations, collections partagĂ©es, rĂ©fĂ©rences bibliographiques, et lecteur PDF intĂ©grĂ© avec highlighting synchronisĂ©. | MĂ©tadonnĂ©e | Valeur | | :--- | :--- | | **Site web** | https://www.i-librarian.net/ | | **GitHub** | https://github.com/mrzv/librarian | | **License** | AGPL-3.0 | | **Langage** | PHP (backend) + JavaScript (frontend), PostgreSQL | | **Étoiles** | ⭐32 | | **DerniĂšre MAJ** | 2026-04-05 | | **CatĂ©gorie** | [[cat-document-management]] | ## Description I, Librarian est un **gestionnaire de bibliothĂšque PDF** conçu pour les **chercheurs, doctorants, enseignants et Ă©quipes de R&D** qui accumulent des centaines/milliers de PDF scientifiques. Contrairement Ă  Calibre (orientĂ© ebooks) ou Paperless (orientĂ© GED), I, Librarian est **spĂ©cialisĂ© dans le workflow de recherche bibliographique** : import depuis DOI/arXiv, extraction de mĂ©tadonnĂ©es BibTeX, indexation full-text, lecteur PDF avec **annotations synchronisĂ©es** (highlights, sticky notes), recherche avancĂ©e multi-critĂšres, et **partage de collections** entre collaborateurs. L'**indexation** est le point fort : I, Librarian extrait le texte intĂ©gral de chaque PDF (via pdftotext ou OCR Tesseract si scannĂ©), indexe dans une base **PostgreSQL** avec extension **Tantivy** (search engine Rust) pour des recherches sub-secondes sur des collections de 100k+ documents. Le **lecteur PDF intĂ©grĂ©** (PDF.js) affiche le document et synchronise les highlights avec la base : vous surlignez un passage dans le PDF, l'annotation est stockĂ©e et retrouvable via la recherche full-text. L'**Ă©cosystĂšme scientifique** comprend : import depuis **Zotero**, **Mendeley**, **DOI batch**, **arXiv bulk** ; export **BibTeX**, **Endnote**, **RIS** ; intĂ©gration **ORCID** pour identifier les auteurs ; systĂšme de **collections** partagĂ©es entre groupes (utile pour un labo ou un dĂ©partement). L'UI est **dense et fonctionnelle** (pas moderne Ă  la Notion, plus « Zotero web »), avec un mode sombre. C'est un projet mature (1Ăšre release 2012), avec une base d'utilisateurs acadĂ©mique solide. ## Installation ### Via Docker Compose (recommandĂ©) ```yaml # docker-compose.yml services: librarian: image: mrzv/librarian:latest container_name: i-librarian restart: unless-stopped ports: - "8084:80" volumes: - librarian-data:/var/www/data - librarian-library:/var/www/library environment: - POSTGRES_HOST=db - POSTGRES_DB=librarian - POSTGRES_USER=librarian - POSTGRES_PASSWORD=*** - LIBRARIAN_SECRET=*** - LIBRARIAN_URL=https://lib.example.com depends_on: - db db: image: postgres:16-alpine container_name: librarian-db restart: unless-stopped environment: - POSTGRES_DB=librarian - POSTGRES_USER=librarian - POSTGRES_PASSWORD=*** volumes: - librarian-db:/var/lib/postgresql/data volumes: librarian-data: librarian-library: librarian-db: ``` > **PrĂ©-requis cĂŽtĂ© hĂŽte** : installer `pdftotext` (poppler-utils), `tesseract-ocr` + langues (`fra`, `eng`), `imagemagick` pour le bon fonctionnement du container. ### Installation manuelle 1. **PrĂ©-requis** : PHP 8.0+, PostgreSQL 13+, Apache/Nginx, `pdftotext` (poppler-utils), `tesseract-ocr`, `imagemagick`, `unzip`, `curl`. 2. **TĂ©lĂ©chargement** : rĂ©cupĂ©rer l'archive depuis [i-librarian.net/download](https://www.i-librarian.net/download/) ou cloner le repo GitHub. 3. **DĂ©ploiement** : copier dans `/var/www/html/librarian`, configurer Apache/Nginx (rewrite rules incluses dans le repo). 4. **Install web** : ouvrir `https://lib.example.com/install/` dans le navigateur, suivre l'assistant (DB, secret, admin). 5. **Premier admin** : créé via l'install wizard. 6. **Crons** : configurer un cron pour `php librarian/cron.php` (indexation pĂ©riodique). ## Configuration - **Premier admin** : créé lors de l'install web, noter le mot de passe. - **Import DOI/arXiv** : dans Library → Import, coller un DOI unique ou un lot (jusqu'Ă  1000 Ă  la fois), le systĂšme tĂ©lĂ©charge et indexe automatiquement. - **MĂ©tadonnĂ©es** : extraction BibTeX automatique, complĂ©tion via CrossRef/OpenAlex. - **OCR** : configurer les langues Tesseract dans Settings → OCR (`fra+eng+deu+spa` pour multi-langue). - **Collections** : crĂ©er des collections thĂ©matiques (ex: « Machine Learning », « Bioinformatique »), assigner des utilisateurs. - **Partage** : activer le partage public de collections dans Settings → Sharing. - **ORCID** : configurer l'intĂ©gration ORCID pour identification automatique des auteurs. - **HTTPS** : obligatoire via reverse proxy. - **Backups** : `pg_dump` + rsync du dossier `library/` (PDF originaux) + `data/` (index). - **Performance** : pour 50k+ documents, prĂ©voir SSD et 8+ Go de RAM (l'index Tantivy est memory-hungry). ## Alternatives ### Open Source - [[app-pdfding]] — gestionnaire PDF minimaliste (Python) - [[app-paperless-ngx]] — GED complĂšte avec OCR (plus gĂ©nĂ©raliste) - [[app-papermerge]] — GED moderne UI Vue (Python) - [[app-stirling-pdf]] — outil PDF complet (Java) - [[app-papra]] — GED TypeScript minimaliste - **Calibre** — gestionnaire ebooks (PDF/EPUB/MOBI) — trĂšs mature - **Zotero** — rĂ©fĂ©rence acadĂ©mique, client + serveur partagĂ© (pas vraiment self-hosted web) - **Alexandria** — bookmark manager PDF - **Paperful** — alternative jeune Ă  I, Librarian ### PropriĂ©taires - **Mendeley** (Elsevier) — rĂ©fĂ©rence acadĂ©mique, freemium, cloud - **Zotero** (cloud optionnel) — gratuit, freemium cloud 2 Go - **EndNote** (Clarivate) — rĂ©fĂ©rence institutionnelle, ~250€/an - **ReadCube Papers** — lecteur PDF acadĂ©mique, freemium - **DEVONthink** — GED Mac/iOS - **Notion + PDF** — pas vraiment bibliothĂšque PDF - **Google Scholar** — recherche, pas stockage - **Papers.app** (ReadCube) — Mac/iOS, freemium ## SĂ©curitĂ© - **HTTPS obligatoire** + HSTS via reverse proxy. - **Auth** : email + mot de passe (bcrypt), sessions PHP server-side. - **2FA** : non natif — compter sur Authelia/Authentik via reverse proxy. - **Permissions** : par utilisateur/collection (lecteur, Ă©diteur, admin). - **SSO** : intĂ©grable via plugins tiers (SAML/OIDC). - **Chiffrement at-rest** : monter les volumes sur stockage chiffrĂ©. - **CVE** : PHP/PostgreSQL Ă  maintenir Ă  jour, suivre les releases I, Librarian. - **Isolation** : ne pas exposer I, Librarian en direct, passer par reverse proxy. - **Backups testĂ©s** : tester la restauration (DB Tantivy + fichiers PDF). - **Quota** : limiter l'upload par utilisateur pour Ă©viter les abus. ## Ressources - Site officiel : https://www.i-librarian.net/ - Documentation : https://www.i-librarian.net/manual/ - GitHub : https://github.com/mrzv/librarian - Forum communautaire : https://www.i-librarian.net/forum/ - selfh.st : https://selfh.st/apps/?tag=document-management ## Pages LiĂ©es - [[cat-document-management]] — catĂ©gorie parente - [[app-pdfding]] — cousin gestionnaire PDF - [[app-paperless-ngx]] — GED plus gĂ©nĂ©raliste - [[app-stirling-pdf]] — outil PDF complĂ©mentaire - [[recettes-docker-compose]] — templates de dĂ©ploiement - [[securisation-home-lab]] — bonnes pratiques sĂ©curitĂ©