Rechnungen / Belege aus PDF's erfassen bzw. scannen und auflisten lassen

Hallo miteinander,

ich suche bereits seit einiger Zeit nach einer Möglichkeit meine vielen Belege auflisten zu lassen.

Aktuell ist mein Workflow meiner Meinung nach zu ineffizient und das Arbeitspensum ist für mich kaum noch zu bewältigen.

Bislang werden Rechnungen und Belege als PDF gescannt, OCRed.

Anschließend trage ich folgende Daten manuell in eine Tabelle mit Spalten ein:

  • Rechnungsdatum
  • RG. Nummer
  • RG. Ersteller bzw. Firma welche die RG erstellt hat
  • ungefähr um was es in der RG geht - Artikel, Posten
  • Betrag inkl. Mwst.

Hoffe auf eure Unterstützung

Vorab danke

Wie willst Du bei der Rechnungsverwaltung Arbeitsschritte sparen? Normal wäre für mich:

  • Rechnung scannen und in einem Ordner unterhalb der Datenbank ablegen.
  • Datensatz wie von Dir beschrieben eingeben. Dabei stellt sich die Frage, ob die Firmen nicht in einer separaten Tabelle untergebracht sind und mit einem Listenfeld einfach ausgelesen werden - hatte ich in der Schule so gemacht.
  • Rechnung mit einem grafischen Kontrollfeld in dem Formular anzeigen.

Wozu Du da irgendetwas mit Texterkennung machen willst erschließt sich mir nicht. Das wäre dann höchstens das, was auflistet, worum es in der Rechnung geht.

1 Like

Habe knapp 1800 Rechnungen als PDF hier liegen. Davon sind nur 8% von wiederkehrenden Rechnungsstellern.

Hierbei geht es weniger ums bezahlen, sondern um die Datenerfassung, leider darf ich nicht näher auf die Details: wieso weshalb warum - eingehen

Möglicher Workaround:

Auf dem Markt gibt es Stiftscanner, vielleicht kann man die von Dir gewünschten Daten damit direkt in die DB-Felder einscannen.

Wurde nicht von mir getestet, ist nur eine Idee.

Je weniger Details, desto mehr werden alle Hilfsversuche allgemein/vage bleiben.

  • Fur künftge Anwendungen kannst Du versuchen ZugPFerD taugliche PDFs per mail zu bekommen und es gibt auch diverse Versuche die relevanten Daten als QR-Code zu integrieren. Bei alten PDFs kann man schauen, ob diese schon direkt Text enthalten, der auswertbar ist.

  • Bei gescannten PDFs kann man Profile für die OCR bilden, oder Scripte erstellen, die versuchen Text an bestimmten Stellen zu extrahieren. Je verschiedener die Rechnungen sind, desto mehr Nacharbeit. Mail-Adressen und IBAN aus DE lassen sich recht gut erkennen, danach wird es schwierig…

  • Nichts davon würde ich IN einem Office-Paket machen. Ausgabe entweder als csv oder direkt in eine Datenbank

  • Du kannst natürlich auf die KI-Lösung warten… Es gibt schon entsprechende Lösungen, Hauptproblem ist erstmal der Datenschutz, da ja oft personenbezogene Daten verarbeitet werden… Ausserdem kann die Nachbearbeitung auch erkannte Daten “verschlimmbessern” - z.B. bei Domain-Namen