Papermerge DMS ist ein 100% Open-Source, selbst gehostetes Dokumentenmanagementsystem, das gescannte Dokumente in durchsuchbare, organisierte Archive verwandelt. Es nutzt die Tesseract OCR-Engine mit Unterstützung für über 100 Sprachen und bietet Dokumentenversionierung, benutzerdefinierte Felder sowie granulare Berechtigungskontrollen. Mit Apache 2.0 Lizenz vollständig kostenlos, ideal für Einzelpersonen und kleine Unternehmen, die vollständige Kontrolle über ihre Dokumente wünschen.




Die Verwaltung von Dokumenten stellt Unternehmen und Privatpersonen vor erhebliche Herausforderungen. Papierbasierte Unterlagen gehen verloren, lassen sich nur schwer durchsuchen und beanspruchen physischen Speicherplatz. Kommerzielle Dokumentenmanagementsysteme (DMS) bieten zwar Funktionalität, sind jedoch oft mit hohen Lizenzkosten verbunden und erzeugen eine Abhängigkeit vom Anbieter. Die Daten werden dabei auf Servern Dritter gespeichert, was Datenschutzbedenken aufwirft.
Papermerge DMS adressiert diese Probleme durch einen vollständig offenen Ansatz. Als zu 100 % quelloffene Lösung unter Apache-2.0-Lizenz können Nutzer das System auf eigenen Servern betreiben und behalten damit die volle Kontrolle über ihre sensiblen Daten. Die Software befindet sich seit Jahren in aktiver Entwicklung – vom初始发布 bis zur aktuellen Version 3.5.3 – und hat sich in der Community etabliert, was 2.900 GitHub-Stars belegen.
Das Herzstück von Papermerge bildet die OCR-Engine auf Basis von Tesseract. Diese ermöglicht die volltextindizierte Suche in gescannten Dokumenten und unterstützt über 100 Sprachen. Ergänzend bietet das System Funktionen zur Versionskontrolle, mit denen jede Änderung an Dokumenten nachvollziehbar bleibt – besonders wichtig für Vertragsmanagement und Finanzbelege.
Die Architektur unterstützt和企业环境: Multi-User-Berechtigungen mit Rollensteuerung (RBAC), SSO-Integration über OIDC/OAuth2 sowie eine REST-API für automatisierte Workflows. Die Bereitstellung erfolgt wahlweise über Docker, Docker Compose, Ansible oder Kubernetes – je nach Anforderung und Infrastruktur.
Die Funktionspalette von Papermerge DMS deckt den gesamten Dokumentenlebenszyklus ab – von der Digitalisierung über die Organisation bis zur langfristigen Archivierung. Jede Funktion ist darauf ausgelegt, konkrete Anwenderprobleme zu lösen.
OCR-Texterkennung mit Tesseract bildet das technische Fundament für die Volltextsuche. Die Open-Source-Engine verarbeitet gescannte PDF-, TIFF-, JPEG- und PNG-Dateien und generiert durchsuchbare Textschichten. Mit Unterstützung für über 100 Sprachen eignet sich das System für internationale Anwendungsfälle. Die OCR-Verarbeitung erfolgt asynchron im Hintergrund, wodurch die Benutzeroberfläche responsiv bleibt.
Versionierung gewährleistet die Nachvollziehbarkeit aller Dokumentenänderungen. Jede Operation – sei es eine OCR-Verarbeitung, eine Metadatenänderung oder eine manuelle Bearbeitung – erzeugt eine neue Version. Die ursprüngliche Datei bleibt unverändert abrufbar. Dies ist insbesondere für Vertragsmanagement, Rechnungswesen und rechtssichere Archivierung relevant.
Benutzerdefinierte Felder ermöglichen die strukturierte Erfassung von Dokumentmetadaten. Anwender definieren Feldvorlagen für spezifische Dokumenttypen: Rechnungen können Felder wie Betrag, Datum und Rechnungssteller enthalten; Verträge lassen sich mit Vertragsnummer, Laufzeit und Parteien strukturieren. Die Felder sind durchsuchbar und können für Filteransichten verwendet werden.
Organisation durch Ordner und Tags bietet flexible Klassifizierungsmechanismen. Die hierarchische Ordnerstruktur ermöglicht logische Gruppierungen, während farbcodierte Tags eine zusätzliche Dimensionsschicht für Statuskennzeichnung oder Projektzuordnung bereitstellen.
Seitenmanagement erlaubt die Korrektur von Scanfehlern auf Dokumentebene. Einzelne Seiten lassen sich drehen, neu anordnen, extrahieren oder zusammenführen – ohne erneutes Scannen des Originaldokuments. Batch-Operationen beschleunigen die Verarbeitung großer Dokumentenstapel.
Zugriffskontrolle implementiert ein differenziertes Berechtigungssystem. Role-Based Access Control (RBAC) ermöglicht die Vergabe von Berechtigungen auf Benutzer- und Gruppenebene. Dokumente können zwischen Benutzern geteilt werden, während Gruppenbesitz die Verwaltung in Unternehmen vereinfacht.
Der Einstieg in Papermerge DMS erfolgt innerhalb weniger Minuten. Für verschiedene Erfahrungsstufen und Einsatzszenarien stehen mehrere Bereitstellungsoptionen zur Verfügung.
Die Docker-Einzelcontainer-Variante eignet sich optimal für erste Tests und Nutzer mit begrenzter Infrastrukturerfahrung. Mit lediglich zwei Umgebungsvariablen (PAPERMERGE__DEFAULT__USER und PAPERMERGE__DEFAULT__PASSWORD) startet der Container. Das System ist nach etwa zwei Minuten einsatzbereit:
docker run -p 8000:8000 \
-v $(pwd)/data:/app/media \
-e PAPERMERGE__DEFAULT__USER=admin \
-e PAPERMERGE__DEFAULT__PASSWORD=admin123 \
papermerge/papermerge:latest
Für produktive Umgebungen empfiehlt sich Docker Compose, das eine vollständige Stack bereitstellt: PostgreSQL-Datenbank, Redis für Aufgabenwarteschlangen und den Suchbackend-Dienst. Diese Konfiguration gewährleistet Stabilität und Skalierbarkeit.
Für Unternehmen und Teams mit höheren Anforderungen ist Docker Compose die bevorzugte Wahl. Die vorkonfigurierte Umgebung enthält alle notwendigen Komponenten und ermöglicht gleichzeitig individuelle Anpassungen. Einzelne Container eignen sich primär für Entwicklung und Evaluierung.
Systemvoraussetzungen umfassen Python/Django als Anwendungsschicht, PostgreSQL oder MySQL als Datenbank, Redis für asynchrone Aufgabenverarbeitung sowie Tesseract OCR mit den gewünschten Sprachpaketen. Die Installation der Sprachpakete erfolgt distributionsspezifisch; für Deutsch genügt typically das Paket tesseract-ocr-deu, für Chinesisch tesseract-ocr-chi-sim.
Weitere Bereitstellungsoptionen adressieren fortgeschrittene Anforderungen: Ansible-Vagrant für automatisierte Setups in Entwicklungsumgebungen, Ansible-Playbooks für Produktionsdeployments sowie Kubernetes-Manifeste für containerorchestrierte Infrastrukturen.
Die technische Architektur von Papermerge DMS kombiniert bewährte Open-Source-Komponenten zu einem leistungsfähigen Gesamtsystem. Das Verständnis der Architektur erleichtert sowohl die Ersteinrichtung als auch die spätere Optimierung.
Das Backend basiert auf Python und Django, einem etablierten Web-Framework mit starker Sicherheitsorientierung. Django übernimmt die Geschäftslogik, Authentifizierung und Administrationsschnittstelle. Die REST-API ermöglicht die Integration mit externen Systemen und die Automatisierung von Workflows.
Tesseract OCR fungiert als Kerntechnologie für die Texterkennung. Als quelloffene Engine mit jahrzehntelanger Entwicklung bietet Tesseract zuverlässige Erkennungsraten und breite Sprachunterstützung. Die Sprachpakete werden separat installiert und ermöglichen bedarfsgerechte Konfiguration.
Der Datenbankschicht unterstützt PostgreSQL und MySQL. PostgreSQL wird für produktive Umgebungen empfohlen, da es erweiterte Volltextsuchfunktionen und bessere JSON-Unterstützung bietet. Die Datenbank speichert Metadaten, Benutzerinformationen, Berechtigungen und Versionierungshistorien.
Redis dient als Nachrichtenbroker für das Celery-Task-Queue-System. OCR-Verarbeitungen und andere rechenintensive Operationen werden asynchron ausgeführt, ohne die Weboberfläche zu blockieren.
Die Speicherschicht bietet Flexibilität zwischen lokalem Dateisystem und S3-kompatiblen Storage-Backends. Für langfristige Archivierung wird das PDF/A-Format unterstützt, das von Normungsinstituten für die gesetzlich vorgeschriebene Dokumentenaufbewahrung anerkannt ist.
Authentifizierungsoptionen umfassen lokale Benutzerverwaltung sowie externe Identitätsprovider über OIDC/OAuth2 und LDAP. Die Integration mit Keycloak, Authentik oder Authelia ermöglicht die Einbindung in bestehende Enterprise-Auth-Infrastrukturen.
Papermerge DMS eignet sich für vielfältige Anwendungsfälle – von der privaten Dokumentenablage bis zur unternehmensweiten Archivierungsstrategie. Die folgenden Szenarien illustrieren typische Einsatzmöglichkeiten.
Persönliche Dokumentenarchivierung stellt für viele Nutzer den Einstiegspunkt dar. Eingescannte Belege, Rechnungen und Verträge werden automatisch OCR-verarbeitet und sind sofort durchsuchbar. Die Volltextsuche lokisiert selbst Dokumente aus vorherigen Jahren innerhalb von Sekunden – ein entscheidender Vorteil gegenüber physischen Archiven. Die Kategorisierung nach Dokumenttyp (Rechnungen, Belege, Verträge) und die Vergabe von Tags ermöglicht intuitive Organisation ohne komplexe Ordnerstrukturen.
KMU-Dokumentenmanagement profitiert von der Selbsthosting-Option. Unternehmen können ihre sensiblen Geschäftsdokumente auf firmeninternen Servern oder dedizierten virtuellen Maschinen betreiben, ohne cloudbasierte Dienste zu nutzen. Die RBAC-Funktionen ermöglichen die Abteilungstrennung: Buchhaltung sieht ausschließlich finanzrelevante Dokumente, Vertrieb hat Zugriff auf Kundenunterlagen. Die Dokumentenfreigabe zwischen Teammitgliedern fördert die Zusammenarbeit bei gleichzeitiger Zugriffskontrolle.
Vertragsversionierung löst ein klassisches Problem im Vertragsmanagement. Jede Änderung eines Vertragsdokuments erzeugt eine neue Version; alle vorherigen Fassungen bleiben abrufbar. Dies gewährleistet Compliance und ermöglicht die Rekonstruktion von Verhandlungsverläufen. Die Kombination mit benutzerdefinierten Feldern (Vertragsnummer, Parteien, Laufzeit) ermöglicht effiziente Filterung und Reporting.
Digitalisierung von Buchhaltungsbelegen beschleunigt Finanzprozesse erheblich. Gescannte Eingangsrechnungen werden OCR-verarbeitet und mit strukturierten Feldern versehen (Rechnungsbetrag, Datum, Steuernummer, Lieferant). Die Feldsuche filtert Belege nach beliebigen Kriterien, was die Prüfung und Kategorisierung für die Buchhaltung vereinfacht. Im Audit-Fall lassen sich relevante Belege schnell identifizieren.
Compliance-Archivierung entspricht den gesetzlichen Anforderungen an Dokumentenaufbewahrung. Das PDF/A-Format garantiert Langzeitlesbarkeit ohne Abhängigkeit von spezifischer Software. Die automatische Versionierung dokumentiert sämtliche Änderungen und unterstützt Nachweispflichten. Die Speicherung auf eigenen Servern gewährleistet Datensouveränität und erleichtert die Einhaltung regionaler Datenschutzvorschriften.
Für Einzelpersonen und kleine Teams bietet der Docker-Einzelcontainer den schnellsten Einstieg – zwei Umgebungsvariablen genügen. Mittelständische Unternehmen profitieren von Docker Compose, das PostgreSQL, Redis und den Suchbackend integriert und damit Produktionsreife gewährleistet.
Ja, vollständig kostenlos. Die Software erscheint unter Apache-2.0-Lizenz, die sowohl private als auch kommerzielle Nutzung ohne Lizenzgebühren erlaubt. Es existieren keine kostenpflichtigen Funktionen oder Enterprise-Upgrades.
Nein, Papermerge wird ausschließlich als selbstgehostete Lösung angeboten. Ein cloudbasiertes SaaS-Angebot existiert nicht. Alle Nutzer betreiben die Software auf ihrer eigenen Infrastruktur.
Das System verarbeitet PDF, TIFF, JPEG und PNG. Diese Formate decken die gängigsten Scan- und Digitalisierungsformate ab.
Ja, Tesseract OCR erkennt Chinesisch (sowohl vereinfacht als auch traditionell). Die entsprechenden Sprachpakete müssen zusätzlich installiert werden, da sie nicht im Standardumfang enthalten sind.
Absolut. Der Docker-Container startet innerhalb von zwei Minuten und erfordert nur grundlegende Docker-Kenntnisse. Die Benutzeroberfläche ist intuitiv gestaltet und erfordert keine Einarbeitung in komplexe Systeme.
Alle Daten werden lokal auf dem Server des Betreibers gespeichert – sei es im lokalen Dateisystem oder auf einem S3-kompatiblen Storage. Eine Übertragung an externe Server erfolgt nicht, sofern keine explizite Konfiguration dies vorsieht.
Ja, das System bietet vollständige Multi-User-Unterstützung mit Gruppenverwaltung, rollenbasierten Berechtigungen und Dokumentenfreigabe. Benutzer können in Gruppen organisiert werden, wobei Gruppenbesitz und dokumentenspezifische Rechte verwaltet werden können.
Der wesentliche Unterschied liegt in der Lizenzierung: Papermerge ist quelloffen und kostenlos, während kommerzielle DMS erhebliche Lizenzkosten verursachen. Als Selbsthosting-Lösung bietet Papermerge volle Datenkontrolle ohne Anbieterabhängigkeit. Der tradeoff besteht darin, dass Betrieb und Wartung in Eigenverantwortung liegen – ein Aspekt, der bei Cloud-Diensten entfällt.
Entdecke die neuesten KI-Tools und steigere noch heute deine Produktivität.
Alle Tools durchsuchenPapermerge DMS ist ein 100% Open-Source, selbst gehostetes Dokumentenmanagementsystem, das gescannte Dokumente in durchsuchbare, organisierte Archive verwandelt. Es nutzt die Tesseract OCR-Engine mit Unterstützung für über 100 Sprachen und bietet Dokumentenversionierung, benutzerdefinierte Felder sowie granulare Berechtigungskontrollen. Mit Apache 2.0 Lizenz vollständig kostenlos, ideal für Einzelpersonen und kleine Unternehmen, die vollständige Kontrolle über ihre Dokumente wünschen.
Alles für dein Coaching Business in einer App
KI-gestützter Website-Builder für alle
KI-Datingfotos die wirklich Matches bringen
Beliebtes KI-Tools-Verzeichnis für Entdeckung und Promotion
Produktveröffentlichungsplattform für Gründer mit SEO Backlinks
Auf der Suche nach kostenlosen KI-Coding-Tools? Wir haben 8 der besten kostenlosen KI-Code-Assistenten für 2026 getestet — von VS Code-Erweiterungen bis zu Open-Source-Alternativen zu GitHub Copilot.
Wir haben die besten KI-Blog-Schreibtools getestet und die 5 besten für SEO gefunden. Vergleiche Jasper, Frase, Copy.ai, Surfer SEO und Writesonic — mit Preisen, Funktionen und ehrlichen Vor-/Nachteilen.