Home > Handbuch > Benutzer-Dokumentation > Dokumente importieren > Dokumentenerkennung Dokumentenerkennung |
Im professionellen Dokumenten-Management-System beschreiben Sie die einzelnen Dokumente mit verschiedensten Eigenschaften (Datenfeldern): Ein Beleg hat beispielsweise die Kategorie "Eingangsrechnung", ein Belegdatum und die Zuordnung zum Lieferanten. Welche Eigenschaften dies sind, entscheiden Sie selbst. Je mehr Eigenschaften Sie nutzen, desto gezielter können Sie die Archive durchsuchen, haben aber auch mehr Aufwand beim Einpflegen. Nutzen Sie die automatisierte Dokumentenerkennung, um diesen Aufwand zu minimieren.
In allen Datenfeldern mit Auswahlliste können Phrasen für die Erkennung hinterlegt werden. Beispielsweise die IBAN oder USt-IdNr. eines Kontaktes oder die Phrase "hiermit bestellen wir" bei der Kategorie "Bestellung". Ist so eine Phrase im Dokumententext enthalten, wird automatisch der entsprechende Kontakt oder die Kategorie zugeordnet.
Ausführliche Beschreibungen mit Beispielen finden Sie im Blog: Kontaktzuordnung und sonstige Auswahllisten.
Je nach Dokumenttyp wird das Sendedatum einer E-Mail oder das Aufnahmedatum aus den Metadaten von Digitalphotos übernommen. Aber auch der Dokumententext kann das Belegdatum enthalten und die interne Belegerkennung sucht nach Daten in verschiedensten Schreibweisen. Wenn mehrere Kalenderdaten vorhanden sind, wird das neueste Datum genommen, welches nicht in der Zukunft liegt.
Wenn die Projektliste Buchungsjahre enthält, wird das zum Datum gehörende Jahr gewählt, und wenn vorhanden, auch der Monat (z. B. "2023\07").
Metadaten, wie Betreff, Sender, Empfänger, Anlagen und Datum.
Zentraler User Guide des Forum elektronische Rechnung Deutschland. Diese PDF-Dokumente beinhalten neben dem für uns Menschen sichtbaren Beleg auch alle Daten in maschinenlesbarer Form.
Microsoft bietet mit den Cognitive Services einen kostenpflichtigen Dienst für die Formularerkennung. Die erforderlichen API-Aufrufe sind in Office Manager DMS integriert, Sie benötigen ein entsprechendes Konto für Microsoft Azure.
Darüber hinaus sind Makrofunktionen für die individuelle Erkennung spezieller Dokumente verfügbar. Beispielsweise Barcodeerkennung, Schlüsselwortsuche, Maskenerkennung, feste Layoutposition, Dateieigenschaften, Datenbankabfragen, Datei- und Verzeichnisnamen, XML- und Konfigurationsdateien mit Metadaten sowie vieles mehr.
Die Erkennungsfunktionen werden in den Scan- und den Importprofilen sowie in Sonderfällen auch in Skripten aktiviert. Wählen Sie den Menübefehl Datei | Optionen | Einstellungen und wechseln Sie zur Seite Scannen | Profile bzw. Importieren | Profile. Öffnen Sie das gewünschte Profil mit einem Doppelklick und wechseln Sie im sich öffnenden Dialogfenster zur Registerseite Feldwerte.
Im unteren Bereich finden Sie das Listenfeld Dokumentenerkennung. Öffnen Sie die Liste und aktivieren Sie die gewünschten Methoden (siehe auch oben).
•Standard-Dokumentenerkennung: Phrasenerkennung und Belegdatum.
•ZUGFeRD-Rechnung: Das Rechnungsdatum wird als Belegdatum übernommen. Weitere Metadaten ordnen Sie mit {AutoCaptZUGFeRD:pfad} den gewünschten Datenfeldern zu.
•Azure Form Recognizer (Cloud): Bitte ordnen Sie die erkannten Daten ordnen mit {AutoCaptAzureAI:pfad} den gewünschten Datenfeldern zu.
Beachten Sie bei einem Scanprofil bitte, dass die OCR-Texterkennung sofort nach dem Scan ausgeführt wird, wenn die Dokumentenerkennung aktiviert ist.
In der Tabelle können Sie zu jedem Datenfeld einen konstanten Text oder eine Makro-Variable hinterlegen. Die linke Spalte beinhaltet die Datenfelder des geöffneten Archivs, die rechte die Feldwerte.
Nutzen Sie die Makro-Variablen, um beispielsweise beim Dateiimport die Eigenschaften aus dem Dateipfad zu generieren. Die Auswahllisten in der Spalte Feldwerte beinhalten Beispiele für die Verwendung der Makro-Variablen.
Die individuellen Einstellungen haben eine höhere Priorität, als die Standard-Dokumentenerkennung.
Feldname |
Feldwert |
Beschreibung |
Name |
{Source:Name} |
Der Dateiname ohne Endung |
Name |
{OleSummaryInformation:Title,{Source}} |
Das erweiterte Dateiattribut "Titel" |
Name |
{GetFirstNotEmpty:{OleSummaryInformation:Title,{Source}},{Source:Name}} |
|
Project |
Die 2. bis 4. Verzeichnisebene |
|
Note |
Datei importiert |
Fester Text "Datei importiert" |
Category |
{Source:DirPart,1,1} |
Die 1. Verzeichnisebene |
Siehe auch
Vorgabewerte für Dokumentattribute