Skip To Content

Indizieren aller Metadateninhalte

Bevor Sie diese Anpassung vornehmen, sollten Sie sich mit den Informationen in den Themen Details zur Lucene-Indizierung im Geoportal und Hinzufügen oder Anpassen eines Profils vertraut machen. Die Indizierung ist ein wichtiger Vorgang, durch den bestimmt wird, welche Suchergebnisse zurückgegeben werden, wenn ein Benutzer Suchkriterien an das Geoportal sendet. Standardmäßig werden nicht alle Metadatenelemente vom Geoportal indiziert. Das Geoportal ist so eingestellt, dass Informationen in einem Metadatendokument indiziert werden, das die folgenden beiden Kriterien erfüllt:

  • Die Informationen müssen unter einem Parameter zu finden sein, der in der Datei definition.xml des Metadatenprofils des entsprechenden Dokuments definiert wurde. Falls die Metadaten keinem Parameter in der Datei definition.xml zugeordnet werden können, kann die Indizierung nicht erfolgen.
  • Dem zugewiesenen Parameter in der Dateidefinition.xml des Profils muss ein meaning-Attribut zugewiesen sein, und zwar gemäß der Definition in der Datei indexables.xml des entsprechenden Profils.
Die Indizierung von nur bestimmten Informationen hat mehrere Vorteile. Zum einen ist der Lucene-Index weniger umfangreich, wenn nur bestimmte Informationen indiziert werden. Suchvorgänge werden somit beschleunigt. Zudem sind einige in den Metadaten enthaltene Informationen für textbasierte Suchvorgänge nicht geeignet. Falls der Metadatensatz beispielsweise eine Miniaturansicht enthält, ist die Indizierung des binären Abschnitts der Miniaturansicht in den Metadaten nicht erforderlich, da die Benutzer nicht nach Zeichen in den Binärdaten suchen werden. Des Weiteren können die Suchergebnisse besser gesteuert werden, wenn festgelegt wird, dass nur bestimmte Informationen indiziert werden sollen. Ein Benutzer, der nach "New York" sucht, erwartet wahrscheinlich Ergebnisse, bei denen "New York" im Titel oder in der Kurzbeschreibung enthalten ist, nicht aber die Adressinformationen des Kontakts.

Falls es aber für Ihre Organisation sehr wichtig ist, dass alle Informationen in einem Metadatendokument durchsuchbar sind, so sollten Sie den gesamten Metadateninhalt indizieren. Führen Sie die folgenden Schritte aus.

  1. Sie müssen in diesem Fall einen zusätzlichen Parameter zur Datei indexables.xml für das Profil hinzufügen, für das der gesamte Index indiziert werden soll. Öffnen Sie die Datei indexables.xml für das entsprechende Profil in einem Texteditor, und führen Sie einen Bildlauf an den Anfang der Datei durch.
  2. Fügen Sie folgende Zeile vor dem schließenden Tag </indexables> ein:
     <property meaning="body" xpath="/rdf:RDF/rdf:Description/*"/>
  3. In diesem Beispiel verweist der Wert xpath auf einen großen Teil des Profils "Dublin Core Metadata". Sie müssen das xpath-Attribut so aktualisieren, dass es mit einem xpath übereinstimmt, das alle Elemente in dem für Sie interessanten Profil einschließt. Im Fall von ISO-basierten Profilen sollte dieses xpath-Attribut beispielsweise xpath="/gmd:MD_Metadata/*" lauten.
  4. Aktualisieren Sie den Wert des xpath-Attributs, sodass er das Profil von Interesse unterstützt.
  5. Speichern Sie die Datei indexables.xml.
  6. Wiederholen Sie diesen Vorgang für sämtliche unterstützte Profile im Geoportal, für die Sie jeweils den gesamten Inhalt indizieren möchten.
  7. Halten Sie die Geoportal-Webanwendung an.
  8. Navigieren Sie zu dem für die Lucene-Indizierung definierten Ordner. Es handelt sich hierbei um den Dateipfad im indexLocation-Attribut des Elements <lucene> in der Datei gpt.xml (im Ordner \\geoportal\WEB-INF\classes\gpt\config).
  9. Sie müssen den alten Index löschen und einen neuen erstellen. Hierfür müssen Sie entweder alle alten Dateien aus dem Ordner für die Lucene-Indizierung löschen oder einen neuen Ordner erstellen und den Dateipfad im Element <lucene> in der Datei gpt.xml entsprechend aktualisieren.
  10. Speichern Sie die Datei gpt.xml, falls Sie Änderungen am Element <lucene> vorgenommen haben.
  11. Starten Sie die Geoportal-Webanwendung. Falls Sie einen neuen Ordner für die indexLocation erstellt haben, werden die Dokumente automatisch neu indiziert, da sich der Speicherort des Lucene-Ordners geändert hat. Dieser Vorgang kann eine gewisse Zeit in Anspruch nehmen: es stellt daher kein Problem dar, wenn die Ergebnisse nicht umgehend angezeigt werden. Falls Sie stattdessen den alten Index durch Entfernen der Indexdateien gelöscht haben, müssen die Dokumente möglicherweise erneut genehmigt und indiziert werden.