Fragen zu Paperless-ngx

Helmut-H

Member
Hallo zusammen,

mittlerweile ist mein Dokumenten-Archiv auf den NAS schon ziemlich umfangreich.
Daher überlge ich Paperless-ngx im Docker-Container zu installieren um meine Dokumente zu indizieren und durchsuchbar zu machen.

Ist Paperless-ngx dafür geeignet?
Verwendet Paperless-ngx die vorhandenen Verzeichnisse / Freigaben, oder müssen die Dokumente nach Paperless-ngx "hochgeladen" werden?
Und sind dann die Dokumente nur über Paperless-ngx erreichbar/lesbar?

So ganz bin da nicht schlau draus geworden.

Das ist dann nützlich, wenn du sowohl vom Container als auch vom host aus auf diesen Ordner zugreifen musst. Beispiel: paperless, da gibt es Ordner, die im Betrieb nicht genutzt werden müssen (Datenbank, läuft alles Container-intern) aber auch Ordner, auf die du zugreifen willst (inbox, media, export für document_exporter). Diese letzteren würdest du dann mit bind mount erledigen.
 
Zuletzt bearbeitet:
Moinsen,
Paperlessngx ist eine Software, die zb pdf Dateien verwaltet, katalogisiert...Hier https://docs.paperless-ngx.com/.
Kurz:
Du hast am Ende einen Ordner, in welchen du pdf Dateien (Mail Anhänger, Rechnungen) oder auch eingescannte Dokumente in PDF Format ablegst, eine inbox.
Paperless nimmt sich diese Dokumente , liest sie ein und kann sie nach Datum, Absender, u.a Regeln direkt abspeichern. Du gibst dann im Idealfall später nur zb "Gasrechnung 2022" in die Suche ein und bekommst sofort eine kleine Auswahl .Muss natürlich erst passend eingerichtet werden.
Ich scann also hier die Papier Rechnung ein per Netzwerk direkt auf die inbox auf dem NAS. Paperless im docker auf dem proxmoxserver verarbeitet dies und fertig. Leicht zu finden per Paperless Datenbank plus originale Datei am eingerichteten Speicherplatz auf dem NAS. Mit einer Erweiterung kannst du auch normale Office Dokumente so speichern bzw katalogisiert ablegen.
Hilft das weiter zur Frage, was es so macht?
Wenn du nun aber bereits viele Dokumente besitzt, dann müssen die alle auch neu eingelesen werden. Das geht dann einfach mit copy and paste...ABER: es macht wirklich Sinn, sich gut und vorher zu überlegen, welche Dateispeicherstruktur du willst. Im workflow mit Paperless wird es dann richtig nett, wenn es antrainiert wurde, das erleichtert es dann später.
Ich nutze hier eine eher flache Struktur, etwa Jahr/Rechnungen/Auto oder IT oder.
Wie du das am besten umsetzt ist der 2. Schritt. ;) Mach dir eeine docker compose Datei und probier es aus. Wenn es dir gefällt , scan 2-3 Dateien oder paste sie in die Inbox. Dann mach dich vertraut mit der doch etwas speziellen backup Möglichkeit, probiere das aus inklusive zurück spielen. Wenn es dir immer noch gefällt, migriere deine Dateien...
Sollte dabei ne konkrete Frage auftauchen, sag gerne Bescheid. :)
 
Zuletzt bearbeitet:
Hallo,

vielen Dank für die Antworten
Es gibt schon eine Ordnerstruktur auf dem NAS wo die PDFs und EPUBS gespeichert sind.
Das wollte ich weitgehend beibehalten.

Die Frage ist: Speichert Paperless-ngx die Dateien doppelt ab, oder werden die "nur " indiziert? Ähnlich wie Jellyfin die Medien einliest.
Liest Paperless-ngx ganze Verzeichnisse ein, oder muss ich jedes Dokument einzeln angeben?

Für Datenbanken in Docker habe ich eine extra Freigabe auf einer NVMe-SSD angelegt, was die Suche z.B. mit Jellyfin sehr schnell macht. Insgesamt aber zu wenig Speicherplatz für alles bietet.

Ich werde Paperless-ngx mal ausprobieren. Ich habe schon viel Zeit mit der Anpassung unserer Medien verbracht - Aber es lohnt sich!
 
Deine bisherige Ordnerstruktur wird nicht übernommen. Paperless-ngx legt sich einen folder “media” an. Darin legt es dann eine eigene Ordnerstruktur ab, die auf dem basiert, was Du für die Dokumente als Klassifizierung vorgibst. Es wird dann pro Jahr nach den “Correspondents” in die Ordner sortiert.
IMG_2206.jpeg
 
Hallo,

danke für die Erläuterungen.
Das ist anders als ich das Erwartet habe. Ich dachte Paperless-ngx scant die Dokumente selber durch und erstellt eine DB zur Stichwortsuche.
Bei mir sind die Dokumente in den Ordnern sortiert. Z. B. Belege + Rechnungen, Anleitungen, Fachbücher usw.
Ich wollte "nur" eine Stichwortsuche zu bestimmten Themen.
 
Stichwortsuche wird bei Paperless-ngx auf zwei Weisen gelöst. Zum einen hast Du die Volltextsuche, zum anderen vergibst Du neuen Dokumenttypen sogenannte “Tags”. Diese lassen sich dann auch zum Filtern verwenden. Wenn Paperless-ngx dann ein Dokument einliest und dieses vom Aufbau einem anderen bereits bekannten Dokument gleicht (also beispielsweise gleicher Korrespondent, ähnlicher beim Scannen gefundener Text), dann bekommt es automatisch auch die Tags zugewiesen. Mit Hilfe der Tags kann dann auch gefiltert werden.
 
Zuletzt bearbeitet:

Zurzeit aktive Besucher

Neueste Beiträge

Letzte Anleitungen

Statistik des Forums

Themen
6.739
Beiträge
64.734
Mitglieder
7.020
Neuestes Mitglied
Martin Schwarz
Zurück
Oben