AutoCapt: Automatische Dokumentenerkennung

Navigation:  Entwicklerhilfe > Makro-Referenz OmAPI

AutoCapt: Automatische Dokumentenerkennung

Previous pageReturn to chapter overviewNext page

Makrofunktionen für die automatisierte Belegerkennung.

Attribut- und Belegerkennung

Die Auto Capture-Funktionen ermöglichen eine automatisierte oder vollautomatische Archivierung von Dokumenten. Die gewünschten Attribute, wie zum Beispiel Belegnummer, Datum, Kunde oder Kategorie, werden dabei aus dem Dokumenteninhalt ermittelt. Bei gescannten Papiervorlagen muss zuvor eine OCR-Texterkennung ausgeführt werden.

Möglichkeiten

Feste Position
Bei der Erkennung von Ausgangsrechnungen und anderen Dokumenten Ihrer Warenwirtschaft stehen die Attribute immer an der gleichen Position des Dokuments. Hier werden die Funktionen AcroExchGetTextFromRect, PDFGetTextFromRect und ImgGetTextFromRect verwendet. Sie geben beispielsweise an, dass die Rechnungsnummer 2cm von links und 7cm vom oberen Papierrand entfernt zu finden ist.

Masken-Erkennung
Die Dokumentnummer steht an einer beliebiger Position, sie hat aber immer die gleiche Syntax. Beispielsweise 2 Zeichen, einen Punkt und 4 Zahlen: "AA.0000".
Siehe: AutoCaptFindMask, FtiFindMask und AutoCaptSelectionListFindItem

Schlüsselwort-Suche
Das gesuchte Attribut folgt auf ein fest vorgegebenes Schlüsselwort. Beispielsweise steht vor der Belegnummer immer der Text "Rechnung-Nr:".
Siehe: AutoCaptKeywordValue und FtiGetKeywordValue

Wort-Suche
Insbesondere für die Erkennung der Kategorie, wie z. B. Rechnung, Angebot oder Lieferschein. Der Funktion wird eine Liste möglicher Wörter übergeben. Sie gibt das Wort zurück, welches zuerst im Dokument vorkommt.
Siehe: AutoCaptFirstCrspWord und FtiGetFirstCrspWord

Strukturierte Daten
Auswertung einer elektronischen Rechnung gemäß dem ZUGFeRD-Standard und Einlesen von E-Mail-Attributen.
Siehe: AutoCaptZUGFeRD, MailGetProperty und InifileReadStr

Weitere Möglichkeiten
Die Attribute werden häufig auch aus dem Speicherpfad ermittelt. Zum Beispiel: das Projekt setzt sich aus dem zweiten bis vierten Teil des Verzeichnisses zusammen und der Kundenname entspricht dem fünften Unterverzeichnis. Oder der Dateiname beinhaltet mehrere Attribute, die mit einem vorgegebenen Zeichen getrennt sind.
Erweiterte Dateieigenschaften, wie Titel und Thema von Office-Dokumenten oder die Metadaten von Digitalfotos.

Verwendung

Die Funktionen werden i. d. R. innerhalb der Scanprofile oder den Importverzeichnissen verwendet. Wechseln Sie dort auf die Seite Feldwerte und geben Sie eine geeignete Funktion beim entsprechenden Attribut ein.

Wenn Sie die AutoCapt-Funktionen verwenden, dann wird die Initialisierung und Freigabe auf Seite Makros angegeben:

Initialisierung und Freigabe der automatischen Belegerfassung

Makrofunktionen

Auto Capture

Nutzen Sie diese bevorzugt, wenn mehrere Funktionen für dasselbe Dokument verwendet werden.

AutoCaptCreate initialisiert die Auto-Capture-Funktionen mit einer Datei

AutoCaptCreateTxt initialisiert die Auto-Capture-Funktionen mit einem Text

AutoCaptDestroy beendet Auto-Capture eines Dokuments

AutoCaptDefault ruft die Standard-Erkennung auf

AutoCaptDocumentText enthält den gesamten Dokumententext

AutoCaptFtiText beinhaltet alle indexierten Wörter des Dokuments

AutoCaptFindMask Masken-Erkennung

AutoCaptFirstCrspWord sucht passendes Wort aus einer Liste

AutoCaptKeywordValue Schlüsselwort-Suche

AutoCaptFtiWord gibt ein bestimmtes Wort zurück

AutoCaptSelectionListFindItem sucht passende Einträge in Auswahllisten, automatische Projektzuordnung

AutoCaptZUGFeRD gibt Daten einer elektronischen Rechnung gemäß dem ZUGFeRD-Standard zurück

Alleinstehende Erkennungsfunktionen

Die Funktionen werden nicht mit AutoCaptCreate eingeleitet. Jeder Aufruf wertet das Dokument erneut aus.

AcroExchGetTextFromRect Text von fester Position im PDF-Dokument lesen

CaptureForm ist eine per INI-Datei konfigurierbare Auswertungsfunktion für ärztliche Formulare u. a.

CSVGetCell CSV-Daten auswerten, beispielsweise für Scanner-Indexdatei

FtiFindMask Masken-Erkennung

FtiGetFirstCrspWord sucht passendes Wort aus einer Liste

FtiGetKeywordValue Schlüsselwort-Suche

ImgGetTextFromRect Text von fester Position in Grafik-Datei lesen

ImgReadBarcode Barcode-Erkennung

MailGetProperty E-Mail-Eigenschaften

RecognizePrescription Rezepterkennung für Heilmittelverordnungen

Pfad und Dateiattribute

FileAttr einfache Dateiattribute

Formatparameter DirPart und Separate

ImgExtractMetaWords Meta-Daten von Grafiken

SelectionListFindItem sucht passende Einträge in Auswahllisten, automatische Projektzuordnung.

OleDocumentSummaryInformation erweiterte Dateiattribute

OleSummaryInformation

OleUserDefinedProperties

Hilfsfunktionen

ExecuteOCR OCR-Texterkennung ausführen

ExtractAttachment Dateianlagen extrahieren

ExtractDocumentText Dokumentinhalt

GetFirstNotEmpty ermöglicht die Verwendung von alternativen Erkennungsfunktionen