Zum Hauptinhalt springen
  1. Projekte/

Papierkram digitalisieren

·4 min·

Was? #

Ich habe zuhause einen wachsenden Berg an Papierkram rumliegen. Behördenschreiben, Verträge, vereinzelte Rechnungen, dies und das. Die sind schon semi-ordentlich abgeheftet, aber weil da ständig was dazukommt ist jede Ordnung nur temporär.

Viel beziehe ich schon digital. Aber digital allein heißt nicht das alles automatisch besser ist. Unsortierte Ordner, Rechnungen die an Emails hängen oder auf zig Plattformen abholbar sind machen mir dort auch teils das Leben schwer.

Es geht also nicht “nur” um das Digitalisieren von Papierkram, sondern auch darum ein System und eine einheitliche Ordnung in der digitalen Welt zu kreieren.

Warum? #

Ab und zu muss ich auf meine Papierdokumente zurückgreifen. Das digital tun zu können, mit Volltextsuche und Filtern, stellt den primären Mehrwert dar.

Außerdem wird mein zukünftiger Workflow für papierhafte Dokumente vereinfacht. Scannen, Import, Vernichten.

Wie? #

Ich habe schon ein ausgefeiltes Note-taking System, in das man diese (Papier-)Unterlagen einbetten könnte. Ich habe mich aber dagegen entschieden diese einfach dort abzulegen.

Praktisch alles was bei mir digital geordnet werden soll fällt in “Referenzen.” Es soll nur abgelegt werden. (Also read-only, kein rum bewegen.) Außerdem wären ein paar Metadaten wie Datum, Korrespondent und steuerliche Einheit sehr nützlich. Das kann alles abgebildet werden, ist aber viel manuelle Arbeit in einer Umgebung die nicht dafür ausgelegt ist.

Software für die Ordnung #

Anforderungen sind also: Volltextsuche, Filter, Metadaten und Automatisierung. Paperless kann das und noch viel mehr. Das System lernt mit der Zeit die Metadaten besser zu befüllen. Hat eine gute UX. Und ich kann das bei mir zuhause auf dem Server laufen lassen (bedeutet: keine Storagelimitationen oder extra Kosten.)

Es ist nicht Teil dieses Guides Paperless aufzusetzen. Das bekommst du alleine hin. Wenn du mich persönlich kennst, kannst du mich fragen, ob ich dir eine Instanz beim mir auf dem Server einrichte.

Software zum Scannen #

Seit vielen Jahren schon benutze ich CamScanner um sehr gut lesbare Scans mit meinem Handy zu erstellen. Es ist eine der Apps, die ich für absolut essentiell halte. Auto-crop, extrem starke Aufhellung und Verbesserung des Bildes, Finger entfernen, mehrere Seiten als PDF zusammenfassen, OCR, schnelle Workflows, Weboberfläche und noch vieles mehr macht diese App zu einem unverzichtbarem Werkzeug.

Umsetzung #

Im ersten Schritt habe ich mir die Struktur der Metadaten überlegt (mit Paperless selbst war ich schon vertraut.)

Metadaten-Struktur #

Für die Arten Dokumenten der Dokumente bin ich zu dieser Auflistung gekommen:

  • Beleg: Etwas das ich bezahlt habe, etwa Rechnung vom ISP oder Laptop-Einkauf
  • Abrechnung: Die Endabrechnung eines gewissen Zeitraumes, etwa Steuerbescheid, Strom- und Nebenkostenabrechnung
  • Vertrag: Vollständige Konditionen zum Vertragsbeginn, etwa Arbeitsvertrag oder Haftpflichtversicherung
  • Anpassung: Veränderung der Konditionen eines Vertrages, etwa Versicherungsanpassung, Miets- oder Gehaltserhöhung
  • Mitteilung: Allgemeine Infos, etwa Steuernummerzuweisung oder Schufa
  • Urkunde: Bescheinigungen jeder Art, etwa Studium, Heirat, HU
  • Versandt: Durch mich abgeschickte Dokumente/Briefe, etwa SEPA-Lastschriftmandat fürs Finanzamt

Der Nutzen ergibt sich daraus nach Bedarf Arten via Filter ein- oder auszuschließen zu können.

Um meine Steuererklärung zu erleichtern, habe ich auch noch Tags, welches die Zugehörigkeit zur einer steuerlichen Identität repräsentieren:

  • Angestelltenverhältnis
  • Selbständigkeit
  • GbR mit meiner Frau

Richtlinien #

Wie soll das Scannen von statten gehen? Auf welche grundlegenden Spielregeln und wichtige Pfeiler will ich während der Durchführung achten?

Was nicht benötigt wird, kommt weg.
Erst überlegen, ob ich dieses Dokument wirklich digitalisieren sollte. Alles was nicht zwingend in Papierform zu behalten ist, wandert nach dem Scannen ins Recycling.

Nicht alles auf einmal.
Wenn ich alles zusammen in Paperless hochlade wird das Machine Learning System die gleichen Fehler wiederholen. Erst wenn ich die Vorschläge verbessere lernt das System wo es lang geht.

Prozess #

Stapel davor aus der Seitenansicht

Der gesamte Durchlauf des Scannen und Verarbeitens hat 4:30h gedauert.

Stapel Davor
Ordner davor
Stapel Danach
Ordner danach

Der davor Stapel hatte sich schon in Grenzen gehalten, weil ich vor zwei Jahren schon radikal ausgemistet hatte.

Paperless stats before
Paperless Statistik davor
Paperless stats after
Paperless Statistik danach

Aussortiertes dient als Schmierpapier
Überreste finden Verwendung als Schmierpapier

Fazit #

Der Prozess war nicht so mühsam wie ich es mir vorgestellt hatte. Und jetzt einfach alle meine Dokumente durchsuchbar zur Verfügung zu haben, ist es auf jeden Fall wert. Paperless und CamScanner haben wie erwartet super funktioniert.