Um eine Suche im Index zu ermöglichen, muss die Option Volltextindex entsprechend ausgewählt sein. Sie können die Mindestlänge der Wörter einstellen, Zahlen ignorieren und die Liste der Stopp-Wörter bearbeiten. Wenn der Index auch über die Dokumentinhalte erstellt wird, können Sie die zu indexierenden Dateitypen und die maximale Dateigröße festlegen.
Wenn Sie die Einstellungen geändert haben und die Änderungen auch für die bereits im Archiv vorhandenen Dokumente durchgeführt werden soll, dann muss der Index neu erstellt werden. Klicken Sie dazu auf den Schalter Index neu erstellen. Beachten Sie bitte, dass diese Funktion sehr zeitaufwändig ist. Bei großen Datenbanken sollte der Index z.B. nachts neu erstellt werden.
Für die Volltextindexierung wird der in den Dokumenten enthaltene Text extrahiert und in den Datenbankindex geschrieben. Das Programm beinhaltet Konvertierungsroutinen, um den Text aus folgenden Dateitypen zu lesen. Die Dokumente werden auch indexiert, wenn sie in einem ZIP-Archiv oder einer E-Mail enthalten sind.
Adobe Acrobat: .pdf
XML Paper Specification: .xps
Microsoft Office: .doc, .docx, .docm, .dotx, .xls, .xlsx, .xlsm, .pptx, .ppsx
OpenOffice.org: .odf, .odg, .odp, .ods, .odt, .sxc, .sxd, .sxi, .sxw
Rich Text Format: .rtf
Word Perfect: .wpd
Textdateien: .txt und alle Dateien, die reinen Text beinhalten
E-Mails: .eml, .msg, .nws
HTML- und XML-Formate: .htm, .html, .xml
Webarchive: .mht, .mhtml
Grafikformate, wenn eine OCR-Texterkennung ausgeführt wird
LotusNotes-Direktzugriff auf E-Mails
Zeichnungen, sofern AutoCAD installiert ist: .dwg
Sie können die Volltextsuche auch für andere Dateitypen aktivieren, indem Sie diese in die Liste der zu indexierenden Dateitypen eintragen. Die Datei wird dann einfach als Textdatei betrachtet und die enthaltenen Wörter indexiert. Hierbei kann sehr viel unbrauchbarer "Text" den Index belasten. Prüfen Sie bitte die Ergebnisse einer Indexierung und entscheiden Sie, ob diese sinnvoll ist.
Dateien werden auch indiziert, wenn sie in folgenden Archivformaten komprimiert sind: .cab, .jar, .tar, .gz, .tgz, .zip
Siehe auch