Home > Handbuch > Entwicklerhilfe > Makro-Referenz OmAPI > AutoCapt: Automatische Dokumentenerkennung AutoCapt: Automatische Dokumentenerkennung |
Makrofunktionen für die automatisierte Belegerkennung.
Die Auto Capture-Funktionen ermöglichen eine automatisierte oder vollautomatische Archivierung von Dokumenten. Die gewünschten Attribute, wie zum Beispiel Belegnummer, Datum, Kontakt oder Kategorie, werden dabei aus dem Dokumenteninhalt ermittelt. Bei gescannten Papiervorlagen muss zuvor eine OCR-Texterkennung ausgeführt werden.
•Feste Position (Bereich-OCR)
Bei der Erkennung von Ausgangsrechnungen und anderen Dokumenten Ihrer Warenwirtschaft stehen die Attribute immer an der gleichen Position des Dokuments. Hier werden die Funktionen AcroExchGetTextFromRect, PDFGetTextFromRect und ImgGetTextFromRect verwendet. Sie geben beispielsweise an, dass die Rechnungsnummer 2cm von links und 7cm vom oberen Papierrand entfernt zu finden ist.
•Masken-Erkennung
Die Dokumentnummer steht an einer beliebiger Position, sie hat aber immer die gleiche Syntax. Beispielsweise 2 Zeichen, einen Punkt und 4 Zahlen: "AA.0000".
Siehe: AutoCaptFindMask, FtiFindMask, AutoCaptFindDate und AutoCaptSelectionListFindItem
•Schlüsselwort-Suche
Das gesuchte Attribut folgt auf ein fest vorgegebenes Schlüsselwort. Beispielsweise steht vor der Belegnummer immer der Text "Rechnung-Nr:".
Siehe: AutoCaptKeywordValue und FtiGetKeywordValue
•Wort-Suche
Insbesondere für die Erkennung der Kategorie, wie z. B. Rechnung, Angebot oder Lieferschein. Der Funktion wird eine Liste möglicher Wörter übergeben. Sie gibt das Wort zurück, welches zuerst im Dokument vorkommt.
Siehe: AutoCaptFirstCrspWord und FtiGetFirstCrspWord
•Strukturierte Daten
Auswertung einer elektronischen Rechnung gemäß dem ZUGFeRD-Standard und Einlesen von E-Mail-Attributen.
Siehe: AutoCaptZUGFeRD, MailGetProperty und InifileReadStr
•Weitere Möglichkeiten
Die Attribute werden häufig auch aus dem Speicherpfad ermittelt. Zum Beispiel: das Projekt setzt sich aus dem zweiten bis vierten Teil des Verzeichnisses zusammen und der Kundenname entspricht dem fünften Unterverzeichnis. Oder der Dateiname beinhaltet mehrere Attribute, die mit einem vorgegebenen Zeichen getrennt sind.
Erweiterte Dateieigenschaften, wie Titel und Thema von Office-Dokumenten oder die Metadaten von Digitalfotos.
Die Funktionen werden i. d. R. innerhalb der Scanprofile oder den Importverzeichnissen verwendet. Wechseln Sie dort auf die Seite Feldwerte und geben Sie eine geeignete Funktion beim entsprechenden Attribut ein.
Wenn Sie die AutoCapt-Funktionen verwenden, dann wird die Initialisierung und Freigabe auf Seite Makros angegeben:
Nutzen Sie diese bevorzugt, wenn mehrere Funktionen für dasselbe Dokument verwendet werden.
•AutoCaptCreate initialisiert die Auto-Capture-Funktionen mit einer Datei
•AutoCaptCreateTxt initialisiert die Auto-Capture-Funktionen mit einem Text
•AutoCaptDestroy beendet Auto-Capture eines Dokuments
•AutoCaptDefault ruft die Standard-Erkennung auf
•AutoCaptDocumentText enthält den gesamten Dokumententext
•AutoCaptFtiText beinhaltet alle indexierten Wörter des Dokuments
•AutoCaptFindMask Masken-Erkennung
•AutoCaptFirstCrspWord sucht passendes Wort aus einer Liste
•AutoCaptKeywordValue Schlüsselwort-Suche
•AutoCaptFtiWord gibt ein bestimmtes Wort zurück
•AutoCaptSelectionListFindItem sucht passende Einträge in Auswahllisten, automatische Projektzuordnung
•AutoCaptZUGFeRD gibt Daten einer elektronischen Rechnung gemäß dem ZUGFeRD-Standard zurück
Die Funktionen werden nicht mit AutoCaptCreate eingeleitet. Jeder Aufruf wertet das Dokument erneut aus.
•AcroExchGetTextFromRect Text von fester Position im PDF-Dokument lesen
•CSVGetCell CSV-Daten auswerten, beispielsweise für Scanner-Indexdatei
•FtiFindMask Masken-Erkennung
•FtiGetFirstCrspWord sucht passendes Wort aus einer Liste
•FtiGetKeywordValue Schlüsselwort-Suche
•ImgGetTextFromRect Text von fester Position in Grafik-Datei lesen
•ImgReadBarcode Barcode-Erkennung
•MailGetProperty E-Mail-Eigenschaften
•FileAttr einfache Dateiattribute
•Formatparameter DirPart und Separate
•ImgExtractMetaWords Meta-Daten von Grafiken
•SelectionListFindItem sucht passende Einträge in Auswahllisten, automatische Projektzuordnung.
•OleDocumentSummaryInformation erweiterte Dateiattribute
•ExecuteOCR OCR-Texterkennung ausführen
•ExtractAttachment Dateianlagen extrahieren
•ExtractDocumentText Dokumentinhalt
•GetFirstNotEmpty ermöglicht die Verwendung von alternativen Erkennungsfunktionen