AcroExchGetTextFromRect
PDFGetTextFromRect

Navigation:  Entwicklerhilfe > Makro-Referenz OmAPI

AcroExchGetTextFromRect
PDFGetTextFromRect

Previous pageReturn to chapter overviewNext page

Makro-Funktion AcroExchGetTextFromRect (nur Enterprise-Version)
Makro-Funktion PDFGetTextFromRect (alle Versionen)

Liest Text aus einem PDF-Dokument, der sich an der angegebenen Position befindet.

Syntax

{AcroExchGetTextFromRect:FileName,PageNum,Left,Right,Bottom,Top,Relative[,ReplaceFrom,ReplaceTo]}

{PDFGetTextFromRect:FileName,PageNum,Left,Right,Bottom,Top,Relative[,ReplaceFrom,ReplaceTo]}

Parameter

FileName: Dateiname des Dokumentes, z. B. {CurrDocFileName} oder {Source}.

PageNum: Seitennummer.

Left, Right, Bottom, Top: Definiert ein Rechteck auf der Seite, in dem sich der zu extrahierende Text befindet. Left und Right geben den Abstand vom linken Seitenrand, Bottom und Top den Abstand vom unteren Rand an. Es sind nur ganze Zahlen erlaubt. Tipp: der Wert von Bottom ist immer kleiner als Top, Left ist kleiner als Right.

Relative: 0, 1 oder 2. Bei 0 wird das Rechteck in der Maßeinheit des PDF-Dokuments (z. B. absolute Pixel) angegeben.
Bei 1 enthalten Left, Right, Bottom und Top prozentuale Werte, wobei Left=10 beispielsweise 10% der Seitenbreite angibt. Berechnungsbeispiel für A4-Seitenbreite: Prozentwert = Runden([mm von links] x 100 / 210).
2 ist ebenfalls relativ, jedoch mit einer berechneten Auflösung von 10.000 statt 100. Berechnungsbeispiel für A4-Seitenbreite: Wert = Runden([mm von links] x 10000 / 210).

ReplaceFrom, ReplaceTo: Mit diesen optionalen Parametern kann eine Textersetzung (s. a. StringReplace) durchgeführt werden.
Beispiel: {AcroExchGetTextFromRect:...,1,{Chr:13}{Chr:10},-} ersetzt alle Zeilenumbrüche durch einen Bindestrich.

Rückgabewert

Dokumententext, der sich im definierten Rechteck befindet.

Beschreibung

Die Funktion gibt den Text zurück, der sich im vorgegebenen Rechteck auf dem PDF-Dokument befindet. Sie wird beispielsweise beim Scannen von Formularen verwendet, um die Dokumentattribute, wie Kategorie oder Kundenname, automatisch vom Papier zu lesen. Bei gescannten Dokumenten muss zuvor die OCR-Texterkennung ausgeführt werden.

AcroExchGetTextFromRect nutzt einen installierten Adobe Acrobat, PDFGetTextFromRect wird mit programminternen Funktionen ausgeführt.

Systemvoraussetzungen für AcroExchGetTextFromRect:

Office Manager Enterprise-Version

Adobe Acrobat-Vollversion

Siehe auch

Tipps zu ArcoExch-Funktionen

Makro-Referenz

Automatische Belegerkennung

ImgGetTextFromRect

ImgExtractMetaWords

AcroExchMergeDocuments

Scan-Profile