Um eine Suche im Index zu ermöglichen, muss die Option Volltextindex entsprechend ausgewählt sein. Sie können die Mindestlänge der Wörter einstellen, Zahlen ignorieren und die Liste der Stopp-Wörter bearbeiten. Wenn der Index auch über die Dokumentinhalte erstellt wird, können Sie die zu indexierenden Dateitypen und die maximale Dateigröße festlegen.
Wenn Sie die Einstellungen geändert haben und die Änderungen auch für die bereits im Archiv vorhandenen Dokumente durchgeführt werden soll, dann muss der Index neu erstellt werden. Klicken Sie dazu auf den Schalter Index neu erstellen. Beachten Sie bitte, dass diese Funktion sehr zeitaufwändig ist. Bei großen Datenbanken sollte der Index z. B. nachts neu erstellt werden.
Die Enterprise-Edition ermöglicht neben der Standard-Volltextsuche auch die Volltextkataloge des MS SQL-Servers. Klicken Sie bitte auf den Schalter SQL Server-Index aktiveren, um die erforderlichen Änderungen in der Archivdatenbank durchzuführen. Der Index muss hierfür vollständig neu aufgebaut werden.
Für die Volltextindexierung wird der in den Dokumenten enthaltene Text extrahiert und in den Datenbankindex geschrieben. Das Programm beinhaltet Konvertierungsroutinen, um den Text aus folgenden Dateitypen zu lesen. Die Dokumente werden auch indexiert, wenn sie in einem ZIP-Archiv oder einer E-Mail enthalten sind (s. a. erweiterte Einstellung IndexAttachments).
Adobe Acrobat: .pdf
XML Paper Specification: .xps, .oxps
Microsoft Office: .doc, .docx, .docm, .dotx, .xls, .xlsx, .xlsm, .pptx, .ppsx
Apache OpenOffice: .odf, .odg, .odp, .ods, .odt, .sxc, .sxd, .sxi, .sxw
e-Book: .epub
Rich Text Format: .rtf
Word Perfect: .wpd
Textdateien: .txt und alle Dateien, die reinen Text beinhalten
Drawing Interchange Format: .dxf
E-Mails: .eml, .msg, .nws
HTML- und XML-Formate: .htm, .html, .xml, .enex
Webarchive: .mht, .mhtml
Metadateien: .emf, .wmf, .qrp (QuickReport)
Grafikformate, wenn eine OCR-Texterkennung ausgeführt wird
Zeichnungen, sofern AutoCAD installiert ist: .dwg
Sie können die Volltextsuche auch für andere Dateitypen aktivieren, indem Sie diese in die Liste der zu indexierenden Dateitypen eintragen. Die Datei wird dann einfach als Textdatei betrachtet und die enthaltenen Wörter indexiert. Hierbei kann sehr viel unbrauchbarer "Text" den Index belasten. Prüfen Sie bitte die Ergebnisse einer Indexierung und entscheiden Sie, ob diese sinnvoll ist.
Dateien werden auch indiziert, wenn sie in folgenden Archivformaten komprimiert sind: .cab, .jar, .tar, .gz, .tgz, .zip
Siehe auch